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Любое использование данного файла означает ваше со- 
гласие с условиями лицензии (см.след.стр.) Текст в дан- 
ном файле полностью соответствует печатной версии книги. 
Электронные версии этой и других книг автора вы можете 
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ПУБЛИЧНАЯ ЛИЦЕНЗИЯ 


Учебное пособие Андрея Викторовича Столярова «Программирование на языке ассемблера 
NASM для ОС ОМІХ», опубликованное в издательстве МАКС Пресс в 2011 году, называемое 
далее «Произведением», защищено действующим авторско-правовым законодательством. Все 
права на Произведение, предусмотренные действующим законодательством, как имуществен- 
ные, так и неимущественные, принадлежат его автору. 

Настоящая Лицензия устанавливает способы использования электронной версии Произве- 
дения, право на которые предоставлено автором и правообладателем неограниченному кругу 
лиц, при условии безоговорочного принятия этими лицами всех условий данной Лицензии. 
Любое использование Произведения, не соответствующее условиям данной Лиценции, а равно 
и использование Произведения лицами, не согласными с условиями Лицензии, ВОЗМОЖНО толь- 
ко при наличии письменного разрешения автора и правообладателя, а при отсутствии такого 
разрешения является противозаконным и преследуется в рамках гражданского, администра- 
тивного и уголовного права. 

Автор и правообладатель настоящим разрешает следующие виды использования данного 
файла, являющегося электронным представлением Произведения, без уведомления правооб- 
ладателя и без выплаты авторского вознаграждения: 


1. Воспроизведение Произведения (полностью или частично) на бумаге путём распечат- 
ки с помощью принтера в одном экземпляре для удовлетворения личных бытовых или 
учебных потребностей, без права передачи воспроизведённого экземпляра другим ли- 
цам; 


2. Копирование и распространение данного файла в электронном виде, в том числе путём 
записи на физические носители и путём передачи по компьютерным сетям, с соблюдени- 
ем следующих условий: (1) все воспроизведённые и передаваемые любым лицам 
экземпляры файла являются точными копиями исходного файла в формате 
PDF, при копировании не производится никаких изъятий, сокращений, дополнений, 
искажений и любых других изменений, включая и изменение формата представления 
файла; (2) распространение и передача копий другим лицам производится 
исключительно бесплатно, то есть при передаче не взимается никакое воз- 
награждение ни в какой форме, в том числе в форме просмотре рекламы, в форме 
платы за носитель или за сам акт копирования и передачи, даже если такая плата 
оказывается значительно меньше фактической стоимости или себестоимости носителя, 
акта копирования и т. п. 


Любые другие способы распространения данного файла при отсутствии письменного разре- 
шения автора запрещены. В частности, запрещается: внесение каких-либо изменений в дан- 
ный файл, создание и распространение искаженных экземпляров, в том числе экземпляров, 
содержащих какую-либо часть произведения; распространение данного файла в Сети Интер- 
нет через веб-сайты, оказывающие платные услуги, через сайты коммерческих компаний, а 
также через сайты, содержащие рекламу любого рода; продажа и обмен физических 
носителей, содержащих данный файл, даже если вознаграждение значительно меньше себе- 
стоимости носителя; включение данного файла в состав каких-либо информационных и иных 
продуктов; распространение данного файла в составе какой-либо платной услуги или в допол- 
нение к такой услуге. С другой стороны, разрешается дарение (бесплатная передача) носи- 
телей, содержащих данный файл, запись данного файла на носители, принадлежащие другим 
пользователям, распространение данного файла через бесплатные файлообменные сети и т.п. 
Ссылки на экземпляр файла, расположенный на официальном сайте автора, разрешены без 
ограничений. 
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Предисловие для преподавателей 


В современной практике индустриального программирования языки ассем- 
блера применяются сравнительно редко; для разработки низкоуровневых про- 
грамм практически в любых ситуациях подходит язык Си, позволяющий до- 
стигать тех же целей многократно меньшими затратами труда, притом с ана- 
логичной, а во многих случаях и более высокой эффективностью получаемого 
исполняемого кода (последнее достигается за счёт применения оптимизаторов). 
С помощью языков ассемблера сейчас реализуются разве что весьма специфи- 
ческие фрагменты ядер операционных систем и системных библиотек. 


Тем не менее, изучение программирования на языке ассемблера являет- 
ся обязательным для студентов всех специальностей, связанных с програм- 
мированием. Это легко объяснить: программист, не имеющий опыта работы 
на уровне команд процессора, попросту не ведает, что на самом деле творит. 
Вставляя в программу на языке высокого уровня те или иные операции, такой 
программист часто не догадывается, сколь сложную и ресурсоёмкую задачу 
он ставит перед процессором. На выходе мы имеем огромные программы, обес- 
кураживающие своей низкой эффективностью — например, приложения для 
автоматизации офисного документооборота, которым оказывается «тесно» в 
четырёх гигабайтах оперативной памяти и для которых оказывается «слишком 
медленным» процессор, на много порядков превосходящий по быстродействию 
суперкомпьютеры восьмидесятых годов. 


Кроме того, иногда ссылки на реализацию на уровне машинных команд 
помогают объяснить студентам средства языков высокого уровня и библио- 
тек. Так, приведя в качестве примера соответствующую ассемблерную вставку, 
можно наглядно показать различие между системным вызовом и его обёрткой 
в виде библиотечной функции. Хорошо помогают низкоуровневые иллюстра- 
ции также и для объяснения ситуаций состязания при работе с разделяемыми 
переменными, ими можно воспользоваться для рассказа о функциях зе пр 
и longjmp и для описания абстракций более высокого уровня, таких как BHP- 
туальные функции в объектно-ориентированном программировании или об- 
работка исключений в языках, подобных Си-+-+ или Аде. Студенту, имеюще- 
му представление о механизме стековых фреймов, оказывается гораздо проще 
объяснить совсем уж, казалось бы, далёкую от фоннеймановского вычислителя 
материю — оптимизацию остаточной рекурсии в Лиспе и других функциональ- 
ных языках. 


Таким образом, обучение программированию на языке ассемблера имеет 
своей целью не создание технических навыков собственно разработки с исполь- 
зованием ассемблеров, а скорее выработку понимания того, что же на самом 
деле представляет собой компьютер и как с его помощью следует решать зада- 
чи. С этой точки зрения не играет существенной роли выбор конкретной плат- 
формы, среды и собственно ассемблера: общие принципы работы центральных 
процессоров различаются мало. С другой стороны, понятно, что использовать 
следует настоящий компьютер, а не эмулятор, даже если это эмулятор реально 
существующего компьютера, поскольку программирование эмулятора оставля- 
ет у студентов ощущение «игрушечности» используемой среды, во многих слу- 
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чаях превращающееся в уверенность, что «с настоящим компьютером ничего 
бы не вышло». 

Большинство существующих учебных пособий по программированию на 
языке ассемблера, ориентировано на ранние процессоры серии 8086, так назы- 
ваемый «реальный» 16-битный режим работы, операционную среду MS DOS и 
один из хорошо известных с тех времён ассемблеров tasm или masm. Причины 
такого выбора хорошо понятны. С одной стороны, с появлением компьютеров 
линии ІВМ РС составителям и преподавателям соответствующих дисциплин в 
ВУЗах волей-неволей пришлось перейти именно на эту платформу, поскольку 
другие оказались недоступны; компьютеры, основанные на архитектуре 80х86, 
до сих пор остаются наиболее доступными для использования в компьютерных 
классах, практически исключая другие аппаратные платформы из рассмотре- 
ния. С другой стороны, с развитием линейки 80х86 возможность запуска про- 
грамм в режиме эмуляции DOS сохранялась, что позволило сэкономить силы, 
не изучая архитектуру более новых процессоров линейки и не адаптируя под 
них существующие учебные курсы. 

Между тем, в современных реалиях такой выбор платформы для изучения 
уже невозможно считать удачным. В самом деле, MS DOS как среда выполне- 
ния программ безнадёжно устарела ещё к середине 1990х годов; сам «реальный 
режим» на современных процессорах поддерживается на уровне микрокода, то 
есть фактически в режиме программной эмуляции, пусть и внутри процессора. 
Кроме того, с переходом к 32-битным процессорам (т.е. начиная с процессо- 
ра 80386) система команд стала существенно более логичной, что подчёркивает 
бессмысленность траты учебного времени на объяснение странностей! архитек- 
туры «реального режима» — странностей, которые заведомо никогда больше 
не появятся ни в одном процессоре. 

Если говорить об использовании 32-битной системы команд (т.н. платфор- 
мы 1386), то выбор операционной среды оказывается сравнительно невелик, 
хотя и более разнообразен, нежели во времена MS DOS: это либо операцион- 
ные системы линии MS Windows, либо представители семейства Unix. И здесь 
необходимо отметить, что при обучении основам программирования (причём 
это относится не только к программированию на языке ассемблера) крайне 
желательно наличие культуры консольных приложений. Написание консоль- 
ных программ для операционной среды, в которой соответствующая культура 
отсутствует, создаёт уже знакомое ощущение «игрушечности» происходящего 
и, к сожалению, существенно расхолаживает студентов; начинать же обучение 
программированию с рисования окошек, что пришлось бы сделать для напи- 
сания полноценных программ под Windows, категорически неприемлемо. 

Кроме того, простой и прозрачный набор системных вызовов ОС Unix, ло- 
гичные правила взаимодействия операционной системы с пользовательским 
процессом, использование в процессах «плоской» (flat) модели адресации ma- 
MATH делают именно операционные системы семейства Unix, в особенности CBO- 


ТВ качестве примера можно назвать, прежде всего, систему адресов, состоящих из 
«сегмента» и «смещения», которая формирует несколько странное понимание терми- 
на «сегмент»; кроме того, следует упомянуть список допустимых регистровых пар в 
исполнительном адресе, ограничение команд условного перехода «короткими» прыж- 
ками ит.д. 
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бодно распространяемые (такие, как Linux и FreeBSD) заведомо более подходя- 
щими для ознакомления студентов со спецификой программирования на языке 
ассемблера. 

Отдельно необходимо пояснить выбор конкретного ассемблера. Как извест- 
но, для работы с процессорами семейства х86 используются два основных под- 
хода к синтаксису языка ассемблера — это синтаксис AT&T и синтаксис Intel. 
Одна и та же команда процессора представляется в этих синтаксических си- 
стемах совершенно по-разному: например, команда, в синтаксисе Intel выгля- 
дящая как 


mov eax, [а+еах] 
в синтаксисе AT&T будет записываться следующим образом: 
movl a(%edx), %eax 


В среде ОС Unix традиционно более популярен именно синтаксис AT&T, но 
в применении к поставленной учебной задаче это создаёт некоторые проблемы. 
Учебные пособия, ориентированные на программирование на языке ассемблера, 
в синтаксисе Intel, всё-таки существуют, тогда как синтаксис AT&T описывал 
ется исключительно в специальной (справочной) технической литературе, не 
имеющей целью обучение. Кроме того, необходимо учитывать и многолетнее 
господство среды MS DOS в качестве платформы для аналогичных учебных 
курсов; всё это позволяет назвать синтаксис Intel существенно более привыч- 
ным для преподавателей (да и для некотрых студентов, как ни странно, тоже) и 
лучше поддерживаемым. В среде ОС Ошх доступно два основных ассемблера, 
поддерживающих синтаксис Intel: это NASM (<Netwide Assembler»), разрабо- 
танный Саймоном Тетхемом и Джулианом Холлом, и ЕАЗМ («Е1аё Assembler»), 
созданный Томашем Гриштаром. Сделать однозначный выбор между этими 
двумя ассемблерами оказывается достаточно сложно. В настоящем пособии 
рассматривается язык ассемблера МАЅМ, в том числе и специфические для 
него макросредства; такой выбор не обусловлен никакими серьёзными причи- 
нами и попросту случаен. 


Предисловие для студентов 


Прежде чем приступать к изучению очередной дисциплины, желательно 
понять, зачем (с какой целью) эта дисциплина вообще изучается. В особенно- 
сти это касается технических предметов, к которым, безусловно, относится и 
курс «Архитектура ЭВМ», в рамках которого обычно изучается программи- 
рование на языке ассемблера. Учебное пособие, которое вы держите в руках, 
ориентировано на программирование на языке ассемблера МАЅМ в среде ОС 
Unix. Между тем, подавляющее большинство профессиональных программи- 
стов, услышав о таком, лишь усмехнётся и задаст риторический вопрос: «да кто 
же пишет под Unix на ассемблере? На дворе ведь ХХІ век!» Самое интересное, 
что при этом они будут совершенно правы. Особенно очевидной становится их 
правота, если вспомнить, что именно ОС Ошх — первая в мире операционная 
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система, которая была написана на языке программирования высокого уров- 
ня, специально для этого придуманном (на языке Си). До появления ОС Ошх 
считалось, что операционные системы можно писать только на языке ассем- 
блера. Более того, в современном мире программирование на языке ассемблера, 
оказалось вытеснено даже из такой традиционно «ассемблерной» области, как 
программирование микроконтроллеров — маленьких однокристалльных ЭВМ, 
предназначенных для встраивания во всевозможную технику, от стиральных 
машин и сотовых телефонов до самолётов и турбин на электростанциях. В 
большинстве случаев прошивки микроконтроллеров сейчас пишут тоже на Си, 
и лишь небольшие вставки выполняют на языке ассемблера. 

Конечно, совсем обойтись без фрагментов на языке ассемблера, пока не по- 
лучается. Отдельные ассемблерные модули, а равно и ассемблерные вставки 
в текст на других языках присутствуют и в ядрах операционных систем, и в 
системных библиотеках того же языка Си (и других языков высокого уровня); 
в особых случаях программисты микроконтроллеров тоже вынуждены отка- 
зываться от Си и писать «на ассеблере», чтобы, например, сэкономить дефи- 
цитную память”. Однако такие случаи редки, и мало кому из вас, изучающих 
ныне программирование на языке ассемблера, придётся хотя бы один раз за 
всю жизнь прибегнуть к языку ассемблера на практике. 

Так зачем же тратить время на изучение ассемблера? Ведь всё равно это 
никогда не пригодится? Так это выглядит лишь на первый взгляд; при более 
внимательном рассмотрении вопроса умение мыслить в терминах машинных 
команд не просто «пригодится», оно оказывается жизненно необходимым лю- 
бому профессиональному программисту, даже если этот программист никогда, 
не пишет на языке ассемблера. На каком бы языке вы ни писали свои програм- 
мы, необходимо хотя бы примерно представлять, что конкретно будет делать 
процессор, чтобы исполнить вашу высочайшую волю. Если такого представле- 
ния нет, программист начинает бездумно применять все доступные операции, 
не ведая, что на самом деле творит. Между тем, одно присваивание, записан- 
ное, скажем, на языке Си+-, может выполниться в одну машинную команду, 
а может повлечь миллионы таких команд?. Два таких присваивания записы- 
ваются в программе совершенно одинаково (знаком равенства), но этот факт 
никак нам не поможет. 

Вообще, профессиональный пользователь компьютеров, будь то програм- 
мист или системный администратор, может себе позволить что-то ме знать, 
но ни в коем случае не может позволить себе не понимать, как устроена вы- 
числительная система, на всех её уровнях, от электронных логических схем до 
громоздких прикладных программ. Не понимая чего-то, мы оставляем в своём 
тылу место для «ощущения магии» : на каком-то глубоком, почти подсознатель- 
ном уровне нам продолжает казаться, что что-то там не чисто и без парочки 
чародеев с волшебными палочками не обошлось. Такое ощущение для про- 
фессионала недопустимо категорически: напротив, профессионал обязан быть 
уверен, вплоть до глубоких слоёв подсознания, что то устройство, с которым он 


2 Например, некоторые микроконтроллеры имеют всего 256 байт оперативной па- 
мяти и 8 Кб псевдопостоянной памяти для хранения кода программы. 

3 Для знающих Си++ поясним: что будет, если применить операцию присваивания 
к объекту типа list<string>, содержащему пару тысяч элементов? 
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имеет дело, создано такими же людьми, как и он сам, и ничего «волшебного» 
или «непознаваемого» собой не представляет. 

В этом плане совершенно не важно, какую конкретную архитектуру и язык 
какого конкретного ассемблера изучать. Зная один язык ассемблера, вы смо- 
жете начать писать на любом другом, потратив два-три часа (а то и меньше) 
на изучение справочной информации; но главное тут в том, что, умея мыслить 
в терминах машинных команд, вы всегда будете знать, что делаете, и всегда 
сможете понять, что происходит. 

В заключение скажем пару слов о причинах выбора конкретной платфор- 
мы. Машины на основе процессоров семейства 1386 мы избрали исключительно 
из-за их широкого распространения. Что касается среды ОС Unix, то среди 
всех возможных операционных сред, имеющихся на платформе 1386, именно 
программирование в ОС Unix оказывается самым простым, ну а лишние слож- 
ности нам ни к чему. 

Итак, теперь вы знаете, что ответить скептикам по поводу программиро- 
вания на языке ассемблера под ОС Unix. Правильным ответом будет фраза 
«нам нужно было попрактиковаться в ассемблерном программиро- 
вании под какую-нибудь существующую систему, всё равно какую, 
а ОС Unix мы выбрали, потому что под ней это делать проще всего». 
Отметим, что эта фраза будет нам полезна, даже если ни одного скептически 
настроенного профессионального программиста мы не встретим: действитель- 
но, ведь здесь одной фразой выражена и наша цель, и принципы, по которым 
мы выбирали средства. 
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Глава 1. Введение 


$ 1.1. Машинный код и ассемблер 


Практически все современные цифровые вычислительные машины 
работают по одному и тому же принципу. Вычислительное устройство 
(собственно сам компьютер) состоит из центрального процессора, 
оперативной памяти и периферийных устройств. В большин- 
стве случаев все эти компоненты подключаются к общей шине — 
устройству из множества параллельных проводов (дорожек на печатной 
плате), позволяющему компонентам компьютера обмениваться информа- 
цией между собой. 

Оперативная память состоит из одинаковых ячеек памяти, каждая 
из которых имеет свой уникальный номер, называемый адресом. Ячейка 
содержит несколько (чаще всего — восемь) двоичных разрядов, каждый 
из которых может находиться в одном из двух состояний, обычно обо- 
значаемых как «ноль» и «единица». Это позволяет ячейке как единому 
целому находиться в одном из 2” состояний, где п — количество разрядов 
в ячейке; так, если разрядов восемь, то возможных состояний ячейки бу- 
дет 28 = 256, или, иначе говоря, ячейка может «помнить» число от 0 до 
255. Если требуется хранить число из ббльшего диапазона, используют 
несколько идущих подряд ячеек памяти. Отметим, что при рассмотре- 
нии нескольких соседних ячеек как представления одного целого числа 
на разных машинах используют два разных подхода к порядку следо- 
вания байтов. Один подход, называемый Ше-еп@ат/, предполагает, что 
первым идёт самый младший байт числа, далее в порядке возрастания, и 
самый старший байт идёт последним. Второй подход, который называют 
big-endian, прямо противоположен: сначала идёт старший байт числа, а 


1 «Термины» big-endians и little-endians введены Джонатаном Свифтом в книге 
«Путешествия Гулливера» для обозначения непримиримых сторонников разбивания 
яиц соответственно с тупого конца и с острого. На русский язык эти названия обычно 
переводились как тупоконечники и остроконечники. Аргументы в пользу той или 
иной архитектуры действительно часто напоминают священную войну остроконечни- 
ков с тупоконечниками. 


8 


младший располагается в памяти последним. Процессоры, которые мы 
будем рассматривать, относятся к категории «И е-еп ап», то есть xpa- 
нят младший байт первым. 

При необходимости содержимое ячейки памяти можно рассматривать 
и как строчку из отдельных двоичных разрядов (битовую строку), и дру- 
гими способами: например, достаточно сложный способ интерпретации 
значений двоичных разрядов используется для хранения дробных чисел, 
так называемых чисел с плавающей точкой. Кроме того, содержи- 
мое ячейки памяти (или нескольких ячеек, идущих подряд) может быть 
истолковано как машинная инструкиия — кодовое число, иденти- 
фицирующее одну из множества операций, которые может выполнять 
центральный процессор. 

Важно понимать, что сама по себе ячейка памяти «не знает», как 
именно следует интерпретировать хранящуюся в ней информацию. Рас- 
смотрим это на простейшем примере. Пусть у нас есть четыре идущие 
подряд ячейки памяти, содержимое которых соответствует шестнадцате- 
ричным числам 41, 4Е, 4Е и 41 (соответствующие десятичные числа — 65, 
79, 79, 65). Информацию, содержащуюся в такой области памяти, можно 
с совершенно одинаковым успехом истолковать: 


® как целое число 1095650881; 
® как дробное число (т.н. число с плавающей точкой) 12.894105; 
® как текстовую строку, содержащую имя ?АММА?; 


è и, наконец, как последовательность машинных команд; в частно- 
сти, на процессорах платформы 1386 это будут команды, условно 
обозначаемые inc ecx, dec езі, 4ес езі, inc ecx. Что делают эти 
команды, мы узнаем позже. 


В процессоре имеется некоторое количество регистров — схем, на- 
поминающих ячейки памяти; поскольку регистры находятся непосред- 
ственно в процессоре, они работают очень быстро, но их количество 
ограничено, так что использовать регистры следует для хранения самой 
необходимой информации. Процессор обладает способностью копировать 
данные из оперативной памяти в регистры и обратно, производить над 
содержимым регистров арифметические и другие операции; в некото- 
рых случаях операции можно производить и непосредственно с данными 
в ячейках памяти, не копируя их содержимое в регистры. 


Наличие или отсутствие такой возможности зависит от конкретного процессора; 
так, процессоры Pentium могут, минуя регистры, прибавить заданное число к содер- 
жимому заданной ячейки памяти и произвести некоторые другие операции, тогда как 
процессоры SPARC, применявшиеся в компьютерах фирмы Sun Microsystems, могут 
только копировать содержимое ячейки памяти в регистр или, наоборот, содержимое 


9 


Количество информации, которую может обработать процессор в 
один приём (за одну команду), называется машинным словом. Раз- 
мер большинства регистров в точности равен машинному слову. В со- 
временных системах машинное слово, как правило, больше, чем ячейка 
памяти; так, машинное слово процессора Pentium составляет 32 бита, то 
есть четыре восьмибитовые ячейки памяти. 

Здесь необходимо сделать одно важное замечание. Процессор Pentium явля- 
ется очередным представителем линейки процессоров х86, и ранние представи- 
тели этой линейки (вплоть до процессора 80286) были 16-разрядными, то есть 
их машинное слово составляло 16 бит. Программисты, работающие с этими про- 
цессорами на уровне языка ассемблера, привыкли называть «словом» именно 
два байта информации, а четыре байта называли «двойным словом», и в языках 
ассемблера использовали соответствующие обозначения (word и дмога). Когда с 
выходом очередного процессора размер слова удвоился, программисты не ста- 
ли менять привычную терминологию, что порождает определённую путаницу. К 
этому вопросу мы ещё вернёмся. 

Программа, предназначенная к выполнению, записывается в опера- 
тивную память в виде последовательности машинных инструкций (ко- 
манд), то есть цифровых кодов, обозначающих те или иные операции. 
Один из регистров процессора, так называемый счётчик команд?, CO- 
держит адрес той ячейки памяти, в которой располагается следующая 
инструкция, предназначенная к выполнению. 


Процессор работает, раз за разом выполняя цикл обработки ко- 
манды. В начале этого цикла из ячеек памяти, на которые указывает“ 
счётчик команд, считывается код очередной команды. Сразу после этого 
счётчик команд меняет своё значение так, чтобы указывать на следую- 
щую команду в памяти; например, если только что прочитанная команда, 
занимала три ячейки памяти, то счётчик команд увеличивается на три. 
Схемы процессора дешифруют код и выполняют действия, предписан- 
ные этим кодом: например, это может быть предписание «скопировать 
число из одного регистра в другой» или «взять содержимое регистра, А, 
прибавить к нему содержимое регистра В, а результат поместить обрат- 
но в регистр А», и т.п. Когда действия, предписанные командой, будут 
исполнены, процессор вновь возвращается к началу цикла обработки ко- 
манд, так что следующий проход этого цикла выполняет уже следую- 
щую команду, и так далее до бесконечности (точнее, пока процессор не 
выключат). 


регистра в ячейку памяти, но никаких других операций над ячейками памяти выпол- 
нять не могут. 

3 Английское название этого регистра — instruction pointer, то есть «указатель на 
инструкцию»; устоявшийся в русскоязычной литературе термин «счётчик команд» не 
столь удачен, ведь этот «счётчик» на самом деле ничего не считает. 

4Выражение вида «нечто указывает на ячейку памяти» является синонимом вы- 
ражения «нечто содержит адрес ячейки памяти». 
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Некоторые машинные команды могут изменить последовательность 
выполнения команд, предписав процессору перейти в другое место про- 
граммы (то есть, попросту говоря, в явном виде изменить текущее значе- 
ние счётчика команд). Такие команды называются командами перехо- 
да. Различают условные и безусловные переходы; команда условного 
перехода сначала, проверяет истинность некоторого условия и производит 
переход, только если условие выполнено, тогда как команда безусловного 
перехода просто заставляет процессор продолжить выполнение команд с 
заданного адреса без всяких проверок. Процессоры обычно поддержива- 
ют также переходы с запоминанием точки возврата, которые использу- 
ются для вызова подпрограмм. 


Ясно, что программа, которую выполняет компьютер, должна быть 
представлена в виде, понятном центральному процессору; такое пред- 
ставление называется машинным кодом. Программа в машинном коде 
состоит из отдельных машинных команд, которые обозначаются чис- 
лами (кодами). Процессор легко может дешифровать такие коды команд, 
но человеку их запомнить очень трудно, тем более что во многих случаях 
нужное число приходится вычислять, подставляя в определённые места 
кодовые цепочки двоичных битов. Вот, например, два, байта, записыва- 
емые в шестнадцатеричной системе как 01 D8 (соответствующие деся- 
тичные значения — 1, 216) обозначают на процессорах Pentium команду 
«взять число из регистра ЕАХ, прибавить к нему число из регистра ЕВХ, 
результат сложения поместить обратно в регистр ЕАХ». Запомнить два 
числа 01 D8 несложно, но ведь разных команд на процессоре Pentium — 
несколько сотен, да к тому же здесь сама команда — только первый 
байт (01), а второй (08) нам придётся вычислить в уме, вспомнив (или 
узнав из справочника), что младшие три бита, в этом байте обозначают 
первый регистр (первое слагаемое, а также и место, куда следует запи- 
сать результат), следущие три бита обозначают второй регистр, а самые 
старшие два бита здесь должны быть равны единицам, что означает, что 
оба операнда являются регистрами. Зная (или, опять же, подсмотрев в 
справочнике), что номер регистра ЕАХ — 0, а номер регистра ЕВХ — 3, мы 
теперь можем записать двоичное представление нашего байта: 11 011 000 
(пробелы вставлены для наглядности), что и даёт в десятичной записи 
216, а в шестнадцатеричной — искомое 18. 


Если нам потребуется освежить в памяти кусочек нашей програм- 
мы, написанный два дня назад, то чтобы его прочитать, нам придётся 
вручную раскладывать байты на составляющие их биты и, сверяясь со 
справочником, вспоминать, что же какая команда делает. Очевидно, что, 
если программиста заставить составлять программы вот таким вот спо- 
собом, ничего полезного он не напишет за всю свою жизнь, тем более что 
в любой, даже самой небольшой, но практически применимой програм- 
ме таких команд будет несколько тысяч, ну а самые большие программы 
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состоят из сотен миллионов машинных команд. 

При работе с языками программирования высокого уровня, такими 
как Паскаль, Си, Лисп и др., программисту предоставляется возмож- 
ность написать программу в виде, понятном и удобном для человека, а 
не для центрального процессора. В этом случае приходится применять 
компилятор — программу, принимающую на вход текст программы на 
языке программирования высокого уровня и выдающую эквивалентный 
машинный код”. Программирование на языках высокого уровня удобно, 
но, к сожалению, не всегда применимо. Причины этого могут быть самые 
разные. Например, язык высокого уровня может не учитывать некото- 
рые особенности конкретного процессора, либо программиста может не 
устраивать тот конкретный способ, которым компилятор реализует те 
или иные конструкции исходного языка с помощью машинных кодов. 
В этих случаях приходится отказаться от языка высокого уровня и со- 
ставить программу в виде конкретной последовательности машинных 
команд. Однако, как мы уже видели, составлять программу непосред- 
ственно в машинных кодах очень и очень сложно. И здесь на помощь 
приходит программа, называемая ассемблером. 

Ассемблер — это программа, принимающая на вход текст, содер- 
жащий условные обозначения машинных команд, удобные для человека, 
и переводящий эти обозначения в последовательность соответствующих 
кодов машинных команд, понятных процессору. В отличие от самих ма- 
шинных команд, их условные обозначения, называемые также мнемо- 
никами, запомнить сравнительно легко. Так, команда из вышеприве- 
дённого примера, код которой, как мы с некоторым трудом выяснили, 
равен 01 D8, в условных обозначениях выглядит так: 


add eax, ebx 


Здесь нам уже не надо заучивать числовой код команды и вычислять в 
уме обозначения операндов, достаточно запомнить, что словом ааа обо- 
значается сложение, причём в таких случаях всегда первым после обо- 
значения команды стоит первое слагаемое (не обязательно регистр, это 
может быть и область памяти), вторым — второе слагаемое (это может 
быть и регистр, и область памяти, и просто число), а результат всегда за- 
носится на место первого слагаемого. Язык таких условных обозначений 
(мнемоник) называется языком ассемблера. 

Программирование на языке ассемблера коренным образом отличает- 
ся от программирования на языках высокого уровня. На языке высокого 


5 Вообще говоря, компилятор — это программа, переводящая программы с одного 
языка на другой; перевод на язык машинного кода — это лишь частный случай, хотя 
и очень важный. 

6 Здесь и далее используются условные обозначения, соответствующие ассемблеру 
NASM, если не сказано иное. 
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уровня (на том же Паскале) мы задаём лишь общие указания, а ком- 
пилятор волен сам выбирать, каким именно способом их исполнить — 
например, какими регистрами и ячейками памяти воспользоваться для 
хранения промежуточных результатов, какой применить алгоритм для 
выполнения какой-нибудь нетривиальной инструкции, и т. д. С целью оп- 
тимизации быстродействия компилятор может переставить инструкции 
местами, заменить одни на другие — лишь бы результат остался неиз- 
менным. В отличие от этого, на языке ассмеблера мы совершенно 
однозначно и недвусмысленно указываем, из каких машинных 
команд будет состоять наша программа, и никакой свободы ас- 
семблер (в отличие от компилятора языка высокого уровня) не 
имеет. 


В отличие от машинных кодов, мнемоники доступны для человека, 
то есть программист может работать с мнемониками без особого труда, 
но это не означает, что программировать на языке ассемблера просто. 
Действие, на описание которого мы бы потратили один оператор язы- 
ка высокого уровня, может потребовать десятка, если не сотни строк на 
языке ассемблера, а в некоторых случаях и больше. Дело тут в том, что 
компилятор языка высокого уровня содержит большой набор готовых 
«рецептов», как решать часто возникающие небольшие задачи, и предо- 
ставляет все эти «рецепты» программисту в виде удобных высокоуров- 
невых конструкций; ассемблер же никаких таких рецептов не содержит, 
так что в нашем распоряжении оказываются только возможности про- 
цессора. 


Интересно, что для одного и того же процессора может существовать 
несколько разных ассемблеров. На первый взгляд это кажется странным, 
ведь не может же один и тот же процессор работать с разными система- 
ми машинных кодов (так называемыми системами команд). В дей- 
ствительности ничего странного здесь нет, достаточно вспомнить, что же 
такое на самом деле ассемблер. Система команд процессора, разумеется, 
не может измениться (если только не взять другой процессор). Однако 
для одних и тех же команд можно придумать разные обозначения; так, 
уже знакомая команда add eax,ebx в обозначениях, принятых в компа- 
нии AT&T, будет выглядеть как addl %еЪх,/еах — и мнемоника другая, 
и регистры не так обозначены, и операнды не в том порядке, хотя полу- 
чаемый машинный код, разумеется, строго тот же самый — 01 18. Кроме 
того, при программировании на языке ассемблера мы обычно пишем не 
только мнемоники машинных команд, но и директивы, представляю- 
щие собой прямые приказы ассемблеру. Следуя таким указаниям, ассем- 
блер может зарезервировать память, объявить ту или иную метку види- 
мой из других модулей программы, перейти к генерации другой секции 
программы, вычислить (прямо во время ассемблирования) какое-нибудь 
выражение и даже сам (следуя, разумеется, нашим указаниям) «напи- 
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сать» фрагмент программы на языке ассемблера, который сам же потом 
и обработает. Набор таких вот директив, поддерживаемых ассемблером, 
тоже может быть разным, как по возможностям, так и по синтаксису. 

Поскольку ассемблер — это не более чем программа, написанная 
вполне обыкновенными программистами, никто не мешает другим про- 
граммистам написать свою программу-ассемблер, что часто и происхо- 
дит. Ассемблер МАЅМ, упоминаемый в названии данного пособия — это 
один из ассемблеров, существующих для процессоров семейства 80х86. 
Существуют и другие ассемблеры; возможно даже, что какой-нибудь из 
них покажется вам более удобным. На самом деле, не так уж важно, язык 
какого конкретного ассемблера, изучать. Важно понять общий принцип 
работы на уровне команд процессора, и после этого вы сможете без тру- 
да освоить не только другой ассемблер, но и любой другой процессор с 
совсем другими командами. 


$1.2. Особенности программирования под 
управлением мультизадачных операционных 
систем 


Поскольку мы собираемся запускать написанные нами программы 
под управлением ОС Unix, нелишним будет заранее описать некоторые 
особенности таких систем с точки зрения выполняемых программ; эти 
особенности распространяются на все программы, выполняющиеся как 
под операционными системами семейства Unix, так и под многими други- 
ми системами, и никак не зависят от используемого языка программиро- 
вания, но при работе на языке ассемблера, становятся особенно заметны. 

Практически все современные операционные системы позволяют зал 
пускать несколько программ на одновременное исполнение. Такой режим 
работы вычислительной системы, называемый мультизадачны.м” , TIO- 
рождает некоторые проблемы, требующие решения со стороны аппара- 
туры (прежде всего — центрального процессора). 

Во-первых, необходимо защитить выполняемые программы друг от 
друга, и саму операционную систему от пользовательских программ. Ес- 
ли (пусть даже не по злому умыслу, а по ошибке) одна из выполняемых 
задач изменит что-то в памяти, принадлежащей другой задаче, скорее 
всего это приведёт к аварии этой второй задачи, причём найти причи- 
ну такой аварии окажется принципиально невозможно. Если пользова- 
тельская задача (опять-таки по ошибке) внесёт изменения в память опе- 


7Термин «задача», строго говоря, довольно сложен, но упрощённо задачу можно 
понимать как «программу, которая запущена на выполнение под управлением опера- 
ционной системы», иначе говоря, при запуске программы в системе возникает задача. 
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рационной системы, это приведёт уже к аварии всей системы, причём, 
опять-таки, без малейшей возможности разобраться в причинах таковой. 
Поэтому центральный процессор должен поддерживать механизм защи- 
ты памяти: каждой выполняющейся задаче выделяется определённая 
область памяти, и к ячейкам за пределами такой области задача, обра- 
щаться не может. 

Во-вторых, в мультизадачном режиме пользовательские задачи, как 
правило, не допускаются к прямой работе с внешними устройствами. 
Если бы это правило не выполнялось, задачи постоянно начинали бы 
конфликтовать за доступ к устройствам, и такие конфликты, разуме- 
ется, приводили бы к авариям. Чтобы ограничить возможности пользо- 
вательской задачи, создатели центрального процессора объявили часть 
имеющихся машинных инструкций привилегированными. Процессор 
может работать либо в привилегированном режиме, также назы- 
ваемом режимом суперпользователя, либо в ограниченном ре- 
жиме, который также называют режимом задачи или пользова- 
тельским режимом?. В ограниченном режиме привилегированные 
команды недоступны. В привилегированном режиме процессор может 
выполнять все имеющиеся инструкции, как обычные, так и привилегиро- 
ванные. Операционная система выполняется, естественно, в привилеги- 
рованном режиме, а при передаче управления пользовательской задаче 
переключает режим в ограниченный. Вернуться в привилегированный 
режим процессор может только при условии одновременной передачи 
управления назад операционной системе, так что код пользовательской 
программы выполняться в привилегированном режиме не может. К кате- 
гории привилегированных относятся инструкции, осуществляющие вза- 
имодействие с внешними устройствами; также в эту категорию попадают 
инструкции, используемые для настройки механизмов защиты памяти и 
некоторые другие команды, влияющие на работу всей системы в целом. 
Все такие «глобальные» действия являются прерогативой операционной 
системы. При работе под управлением мультизадачной опера- 
ционной системы пользовательская задача может лишь преоб- 
разовывать информацию в отведённой ей области оперативной 
памяти. Всё взаимодействие с внешним миром задача произво- 
дит через обращения к операционной системе. Даже просто вы- 
вести на экран строку задача, самостоятельно не может, ей необходимо 
попросить об этом операционную систему. Такое обращение пользова- 


8 Из этого правила есть исключения, связанные, например, с отображением графи- 
ческой информации на дисплее, но в этом случае устройство должно быть закреплено 
за одной пользовательской задачей и строго недоступно для других задач. 

9На самом деле процессор 1386 и его потомки имеют не два, а четыре режима, 
называемые также кольцами защиты, но реально операционные системы используют 
только нулевое кольцо (высший возможный уровень привилегий) и третье кольцо 
(низший уровень привилегий). 
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тельской задачи к операционной системе за теми или иными услугами 
называется системным вызовом. Интересно, что завершение задачи 
тоже может выполнить только операционная система. Таким образом, 
корректная пользовательская задача обойтись без системных вызовов не 
может никак, ведь даже просто завершиться она может только с помо- 
шью соответствующего системного вызова. 


Ещё один важный момент, который необходимо упомянуть перед Ha- 
чалом изучения конкретного процессора — это наличие в нашей опера- 
ционной среде механизма виртуальной памяти. Попробуем понять, 
что это такое. Как уже говорилось, оперативная память делится на оди- 
наковые по своей ёмкости ячейки (в нашем случае каждая ячейка со- 
держит 1 байт данных), и каждая такая ячейка имеет свой порядковый 
номер. Именно этот номер использует центральный процессор для ра- 
боты с ячейками памяти через общую шину, чтобы отличать их одну 
от другой. Назовём этот номер физическим адресом ячейки памяти. 
Изначально никаких других адресов, кроме физических, у ячеек памя- 
ти не было. В машинном коде программ использовались именно физи- 
ческие адреса, которые называли просто «адресами», без уточняющего 
слова «физический». Однако с развитием мультизадачного режима ра- 
боты вычислительных систем оказалось, что в силу целого ряда причин 
использование физических адресов неудобно. Например, программа в ма- 
шинном коде, в которой используются физические адреса ячеек памяти, 
не сможет работать в другой области памяти — а ведь в мультизадачной 
ситуации может оказаться, что нужная нам область уже занята другой 
задачей. Есть и другие причины, которые обычно подробно рассматри- 
ваются в учебных курсах, посвященных операционным системам. 


В современных процессорах используется два вида адресов. Сам про- 
цессор работает с памятью, используя уже знакомые нам физические 
адреса. А вот в программах, которые на процессоре выполняются, ис- 
пользуются совсем другие адреса — виртуальные. Виртуальный ад- 
рес — это число из некоторого абстрактного виртуального адресного 
пространства. На тех процессорах, с которыми мы будем работать, 
виртуальные адреса, представляют собой 32-битные целые числа, то есть 
виртуальное адресное пространство есть множество целых чисел от 0 
до 232 — 1; адреса обычно записываются в шестнадцатеричной системе, 
так что адрес может быть числом от 00000000 до ffffffff. Важно no- 
нимать, что виртуальный адрес совершенно не обязан соответствовать 
какой-либо ячейке памяти. Точнее говоря, некоторые виртуальные ад- 
реса соответствуют физическим ячейкам памяти, другие — не соответ- 
ствуют, а некоторые адреса и вовсе могут то соответствовать физиче- 
ской памяти, то не соответствовать. Такие соответствия задаются путём 
соответствующей настройки центрального процессора; за эту настрой- 
ку отвечает операционная система. Будучи соответствующим образом 
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настроенным, центральный процессор, получив из очередной машинной 
инструкции виртуальный адрес, преобразует его в адрес физический, 
и тогда уже обращается к оперативной памяти. Таким образом, мы в 
программах используем в качестве адресов не физические номера ячеек 
памяти, а некие абстрактные адреса, которые потом уже сам процессор 
преобразует в настоящие номера ячеек. Это позволяет, например, каждой 
программе иметь своё собственное адресное пространство: действитель- 
но, никто не мешает операционной системе настроить преобразования 
адресов так, чтобы один и тот же виртуальный адрес в одной пользо- 
вательской задаче отображался на одну физическую ячейку, а в другой 
задаче — на совсем другую. 


Вопросы, связанные с созданием новых операционных систем, мы в 
нашем пособии рассматривать не будем. Вместо этого мы ограничимся 
рассмотрением возможностей процессора 1386, доступных пользователь- 
ской задаче, работающей в ограниченном режиме. Более того, даже эти 
возможности мы рассмотрим не все; дело в том, что операционные си- 
стемы семейства UNİX выполняют пользовательские задачи в так назы- 
ваемой плоской модели адресации памяти, в которой не используется 
часть регистров и некоторые виды машинных команд. На изучение этих 
регистров и команд мы не будем тратить время, поскольку всё равно не 
сможем их применить. Позже в нашем курсе мы подробно рассмотрим 
механизмы взаимодействия с операционной системой, включая и способы 
организации системного вызова для систем Linux и FreeBSD; однако no- 
ка нам эти механизмы не известны, мы будем осуществлять ввод/вывод 
и завершение программы с помощью готовых макросов — специальных 
идентификаторов, которые наш ассемблер развернёт в целые последова- 
тельности машинных команд и уже в таком виде оттранслирует. Отме- 
тим, что к концу нашего курса мы сами научимся при необходимости 
создавать такие макросы. 


$ 1.3. Машинное представление целых чисел 


Подавляющее большинство компьютеров, созданных за всю историю 
вычислительной техники, обрабатывало и обрабатывает любую инфор- 
мацию, представляя её в двоичной системе, то есть в виде последователь- 
ности разрядов, каждый из которых может содержать одно из двух воз- 
можных значений (включено/выключено), обозначаемых обычно цифра- 
ми 0 и 1. Разумеется, это касается и целых чисел; читатель, несомненно!0, 
уже знаком с двоичной системой счисления, в которой для записи чисел 


используются только две цифры (всё те же ноль и единица). Впрочем, 


10 Отметим на всякий случай, что изучение двоичной системы и других позицион- 
ных систем счисления входит в обязательную программу для средних школ. 
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Рис. 1.1. Механический счётчик 


компьютеры, будучи реально существующими техническими устройства- 
ми, накладывают некоторые ограничения на представление целых чисел. 
Из математики мы знаем, что ряд чисел бесконечен, то есть каково бы ни 
было число М, всегда существует следующее число N +1. Для этого и KO- 
личество знаков в записи числа, какую бы систему мы ни использовали, 
не должно никак ограничиваться — но вот как раз это требование испол- 
нить технически невозможно (даже чисто теоретически: ведь количество 
атомов во вселенной считается конечным). 


6 1.3.1. Беззнаковые числа 


На практике для компьютерного представления целого числа выделя- 
ется некоторое фиксированное!! количество разрядов (бит); обычно это 
8 бит (одна ячейка), 16 бит (две ячейки), 32 бита, (четыре ячейки) или 
64 бита, (восемь ячеек). Ограничение разрядности приводит к появлению 
«наибольшего числа», причём это касается не только двоичной системы. 
Представьте себе, например, простое счётное устройство, используемое 
в электрических счётчиках и механических спидометрах старых автомо- 
билей: цепочку роликов, на которых нанесены цифры и которые могут 
прокручиваться, а проходя через «точку переноса» (с девятки на ноль), 
прокручивают на единицу следующий ролик. Допустим, такое устрой- 
ство состоит из пяти роликов (см. рис. 1.1). Сначала мы видим на нём 
число ноль: 00000. По мере прокручивания правого ролика число будет 
меняться, мы увидим 00001, потом 00002, и так далее вплоть до 00009. 
Если теперь провернуть самый правый ролик ещё на единичку, мы снова 
увидим в правой позиции ноль, но при этом самый правый ролик заце- 
пит своего соседа, слева и заставит его провернуться на единичку, так что 
мы увидим 00010, то есть число десять; мы наблюдали при этом хорошо 


11 Некоторые языки программирования высокого уровня позволяют оперировать 
сколь угодно большими целыми числами, лишь бы хватило памяти; но такие возмож- 
ности всегда реализуются программно (и довольно сложно), а мы сейчас рассматри- 
ваем программирование на низком уровне, которое отталкивается от возможностей 
процессора. 
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известный с младших классов перенос: «девять плюс один, ноль пишем, 
один в уме». То же самое произойдёт при переходе от числа 00019 к 
числу 00020, и так далее, а когда мы увидим число 00099 и прокрутим 
правый ролик ещё на единичку, в зацепление попадут сразу два его со- 
седа, так что на единицу вперёд прокрутятся сразу три ролика, и мы 
получим число сто: 00100. 


Теперь уже несложно будет понять, откуда берётся такой монстр, как 
«наибольшее возможное число»: рано или поздно наш счётчик досчита- 
ет до 99999, и теперь увеличивать число окажется некуда; когда мы в 
очередной раз прокрутим правый ролик на единицу вперёд, он зацепит 
за собой все остальные ролики, так что они все перейдут на следующую 
цифру, и мы снова увидим одни нули. Если бы у нас слева, был ещё один 
ролик, он бы зацепился и показал единичку, так что результат бы был 
100000 (что совершенно правильно), но у нас всего пять роликов, шестого 
нет. Такая ситуация называется перенос в несуществующий разряд. 
Ясно, что такая ситуация не может возникнуть, когда мы пишем числа 
на бумаге: всегда можно дописать ещё одну цифру слева; когда, же число 
представлено состоянием некой группы технических устройств, будь то 
цепочка роликов или набор триггеров в оперативной памяти компьютера, 
возможности приделать к числу ещё одну цифру у нас нет. 


При использовании двочиной системы счисления происходит пример- 
но то же самое с той разницей, что используется всего две цифры. До- 
пустим, мы используем для подсчёта каких-нибудь предметов или со- 
бытий ячейку памяти, которая содержит восемь разрядов. Сначала, в 
ячейке ноль: 00000000. Добавив единицу, получаем двоичное представ- 
ление единицы: 00000001. Добавляем ещё одну единицу, младший (са- 
мый правый) разряд увеличивать некуда, поскольку у нас только две 
цифры, поэтому он снова становится нулевым, но при этом происходит 
перенос, в результате которого единица появляется во втором разряде: 
00000010; это двоичное представление числа 2. Далыпе будет 00000011, 
00000100 и так далее; но в какой-то момент во всех имеющихся разрядах 
окажутся единицы, так что прибавлять дальше будет некуда: 11111111; 
это двоичное представление числа 255 (28 — 1). Если теперь прибавить 
ещё единицу, вместо числа 256 мы получим «все нули», то есть просто 
ноль; произошел уже знакомый нам перенос в несуществующий разряд. 
Вообще, при использовании для представления целых положи- 
тельных чисел позиционной несмешанной системы счисления 
по основанию № и ограничении количества разрядов числом k 
максимальное число, которое мы можем представить, составля- 
ет № — 1; так, в нашем примере со счётчиком было пять разрядов деся- 
тичной системы, и максимальным числом оказалось 99999 = 10° — 1, ав 
примере с восьмибитной ячейкой система, использовалась двоичная, раз- 
рядов было восемь, так что максимальным числом оказалось 28—1 = 255. 
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6 1.3.2. Знаковые числа; дополнительный код 


Посмотрим теперь, как быть, если нужны не только положительные 
числа. Ясно, что нужен какой-то другой способ интерпретации комбина- 
ций двоичных разрядов, такой, чтобы какие-то из комбинаций считались 
представлением отрицательных чисел. Будем в таких случаях говорить, 
что ячейка или область памяти хранит знаковое целое число, в отличие 
от предыдущего случая, когда говорят о беззнаковом целом числе. 

На заре вычислительной техники для представления отрицательных 
целых чисел пытались использовать разные подходы, например, хра- 
нить знак числа как отдельный разряд. Оказалось, однако, что при этом 
неудобно реализовывать даже самые простые операции — сложение и 
вычитание, потому что приходится учитывать знаковый бит обоих сла- 
гаемых. Поэтому создатели компьютеров достаточно быстро пришли к 
использованию так называемого дополнительного кода!?. Если oT- 
рицательные числа представлять этим способом, сложение и вычитание 
реализуется на аппаратном уровне абсолютно одинаково вне зависимо- 
сти от знаков слагаемых и даже от самого факта их «знаковости»: мы 
можем по-прежнему рассматривать все возможные битовые комбинации 
как представление неотрицательных чисел (то есть вернуться к беззна- 
ковой арифметике), и схематически сложение и вычитание от этого не 
изменятся. Больше того, отпадает вообще надобность в отдельном элек- 
тронном устройсте для вычитания: операция вычитания может быть ре- 
ализована как операция прибавления числа, которому сначала сменили 
знак, причём это, как ни парадоксально, работает и для беззнаковых 
чисел. 

Чтобы понять, как устроен дополнительный код, вернёмся к наше- 
му примеру с механическим счётчиком. В большинстве случаев такие 
роликовые цепочки умеют крутиться как вперёд, так и назад, и если 
прокрутка вперёд давала нам прибавление единицы, то прокрутка, назад 
будет выполнять вычитание единицы. Пусть теперь у нас все ролики вы- 
ставлены на ноль и мы откручиваем счётчик назад. Результатом этого 
будет 99999; оно и понятно, ведь когда мы к 99999 прибавили единицу, 
то получилось 00000, а теперь мы проделали обратную операцию. Гово- 
рят, что у нас произошел заём из несуществующего разряда: как 
и в случае с переносом в несуществующий разряд, если бы у нас был 
ещё один ролик, всё бы было правильно (например, 100000 — 1 = 99999), 
но его нет. То же самое происходит и в двоичной системе: если во всех 
разрядах ячейки были нули (00000000) и мы вычли единицу, получим 
все единицы: 11111111; если теперь снова прибавить единицу, мы снова 


12 Английский термин — two’s complement, то есть «двоичное дополнение»; надо 
сказать, что ничего нового в использовании этого метода не было, метод десятич- 
ных дополнений использовал ещё Блез Паскаль для выполнения вычитаний на своем 
арифмометре. 
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получим нули во всех разрядах. Это логично приводит нас к идее ис- 
пользовать в качестве представления числа -1 единицы во всех 
разрядах двоичного числа, сколько бы ни было у нас таких разрядов. 
Так, если мы работаем с восьмиразрядными числами, 11111111 у нас те- 
перь означает -1, а не 255; если мы работаем с шестнадцатиразрядными 
числами, 1111111111111111 теперь будет обозначать, опять-таки, -1, а 
не 65535, и так далее. 


Продолжая операцию по вычитанию единицы над восьмиразрядной 
ячейкой, мы придём к заключению, что для представления числа -2 
нужно использовать 11111110 (раньше это было число 254), для пред- 
ставления -3 — 11111101 (раньше это было 253), и так далее. Иначе 
говоря, мы волюнтаристски объявили часть комбинаций двоичных раз- 
рядов представляющими отрицательные числа вместо положительных, 
причём всегда новое (отрицательное) значение комбинации разрядов по- 
лучается из старого (положительного) путём вычитания из него числа 
256: 255 — 256 = —1, 254 — 256 = —2 ит.д. (число 256 представляет собой 
28, а наши рассуждения верны только для частного случая с восьмираз- 
рядными числами; в общем случае из старого значения нужно вычитать 
число 2”, где п — используемая разрядность). Остаётся вопрос, в какой 
момент остановиться, то есть перестать считать числа отрицательными; 
иначе, увлёкшись, мы можем дойти до 00000001 и заявить, что это вовсе 
не 1, а -255. Принято следующее соглашение: если набор двоичных 
разрядов рассматривается как представление знакового числа, 
то отрицательными считаются комбинации, старший бит ко- 
торых равен 1, а остальные комбинации считаются положительными. 
Таким образом, наибольшее по модулю отрицательное число будет пред- 
ставлено одной единицей в старшем разряде и нулями во всех остальных; 
в восьмибитном случае это 10000000, -128. Если из этого числа, вычесть 
единицу, получится 01111111; эта комбинация (старший ноль, осталь- 
ные единицы) считается представлением наибольшего знакового числа 
и для восьмибитного случая представляет, как несложно видеть, число 
127. Как вы уже догадались, прибавление единицы к этому числу сно- 
ва даст наибольшее по модулю отрицательное. Переход через границу 
между комбинациями 011...11 и 100...00 для знаковой целочисленной 
арифметики!3 представляет собой аналог переноса и займа для несуще- 
ствующего разряда, который мы наблюдали в арифметике беззнаковой, 
но называется эта ситуация иначе: переполнение. 


Именно такое, а не какое-либо другое расположение границы пере- 
полнения даёт две приятные возможности. Во-первых, знак числа можно 
определить, взяв от него всего один (старший) бит. Во-вторых, оказывал 
ется очень простой операция смены знака числа. Чтобы сменить знак 


13То есть когда сумма двух положительных оказывается отрицательной и наоборот. 
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числа на противоположный при использовании дополнительно- 
го кода, достаточно сменить значения во всех разрядах на про- 
тивоположные, а к полученному значению прибавить единицу. 
Например, число 5 представляется следующим восьмибитным знаковым 
целым: 00000101. Чтобы получить представление числа -5, мы сначала 
инвертируем все разряды, получаем 11111010; теперь прибавляем еди- 
ницу и получаем 11111011, это и есть представление числа -5. Для на- 
глядности проделаем смену знака ещё раз: инвертируем все биты в пред- 
ставлении числа -5, получаем 00000100, прибавляем единицу, получаем 
00000101, то есть снова число 5, что и требовалось. Как несложно убе- 
диться, для представления нуля операция смены знака  инвариантна, то 
есть ноль остаётся нулём: 00000000 1" 11111111 + 00000000. 


Такая же ситуация несколько неожиданно возникает для числа -128 (в BOCb- 
мибитном случае) или, говоря вообще, для максимального по модулю отрица- 


u inv. +1 
тельного числа заданной разрядности: 100000000 — 01111111 — 10000000. 
Это обусловлено отсутствием в данной разрядности положительного числа с та- 
ким же модулем, то есть при применении операции замены знака к комбинации 


100...00 происходит переполнение. 


$ 1.4. История платформы 1386 


В 1971 году корпорация Intel выпустила в свет семейство микросхем, 
получившее название МСЅ-4. Одна из этих микросхем, Intel 4004, пред- 
ставляла собой первый в мире законченный центральный процессор на 
одном кристалле, т.е., иначе говоря, первый в истории микропроцес- 
сор. Машинное слово" этого процессора составляло четыре бита. Год 
спустя Intel выпустила восьмибитный процессор Intel 8008, а в 1974 ro- 
ду — более совершенный Intel 8080. Интересно, что 8080 использовал 
иные коды операций, но при этом программы, написанные на языке ас- 
семблера для 8008, могли быть без изменений оттранслированы и для 
8080. Аналогичную «совместимость по исходному коду» конструкторы 
Intel поддержали и для появившегося в 1978 году 16-битного процессора 
Intel 8086. Выпущенный годом позже процессор Intel 8088 представлял 
собой практически такое же устройство, отличающееся только разряд- 
ностью внешней шины (для 8088 она составляла 8 бит, для 8086 — 16 
бит). Именно процессор 8088 был использован в компьютере 1ВМ РС, 
давшем начало многочисленному и невероятно популярному! семейству 


14 Напомним, что машинным словом называется порция информации, обрабатыва- 
емая процессором в один приём. 

15 Популярность ІВМ-совместимых машин представляет собой явление весьма неод- 
нозначное; многие другие архитектурные решения, имевшие существенно лучший ди- 
зайн, не смогли выжить на рынке, затопленном ІВМ-совместимыми компьютерами, 
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машин, до сих пор называемых IBM РС-совместимыми или просто 
ІВ М-совместимыми. 

Процессоры 8086 и 8088 не поддерживали защиты памяти и не име- 
ли разделения команд на обычные и привилегированные, так что за- 
пустить мультизадачную операционную систему на компьютерах с эти- 
ми процессорами было невозможно. То же самое можно было сказать и 
относительно пропессора 80186, выпущенного в 1982 году. В сравнении 
со своими предшественниками этот процессор работал гораздо быстрее 
за счёт аппаратной реализации некоторых операций, выполнявшихся в 
предыдущих пропессорах путём исполнения микрокода, и за счёт повы- 
шения тактовой частоты. Процессор включал в себя некоторые подси- 
стемы, которые ранее требовалось поддерживать с помощью дополни- 
тельных микросхем — такие как контроллер прерываний и контроллер 
прямого доступа к памяти. Кроме того, система команд процессора была 
расширена введением дополнительных команд; так, стало возможным с 
помощью одной команды занести в стек все регистры обшего назначе- 
ния. Адресная шина процессоров 8086, 8088 и 80186 была 20-разрядной, 
что позволяло адресовать не более 1 МЬ оперативной памяти. 

В том же 1982 году увидел свет и процессор 80286, ставший последним 
16-битным процессором в рассматриваемом ряду. Этот процессор поддер- 
живал так называемый защищённый режим работы (protected mode), в 
котором реализовывалась сегментная модель виртуальной памяти, под- 
разумевающая, в том числе, и защиту памяти; четыре кольца защиты 
позволили запретить пользовательским задачам выполнение действий, 
влияющих на систему в целом, что необходимо при работе мультизадач- 
ной операционной системы. Адресная шина получила четыре дополни- 
тельных разряда, увеличив, таким образом, максимальное количество 
непосредственно доступной памяти до 16 МЬ. 

Однако по-настоящему мультизадачные операционные системы бы- 
ли реализованы лишь на следующем процессоре в ряду, 32-разрядном 
Intel 80386, для краткости обозначаемом просто «1386». Этот процессор, 
массовый выпуск которого начался в 1986 году, резко отличался от своих 
предшественников, прежде всего, увеличением регистров до 32 бит, суще- 
ственным расширением системы команд, увеличением адресной шины до 
32 разрядов, что позволяло непосредственно адресовать до 4 СЪ физиче- 
ской памяти. Добавление поддержки страничной организации вир- 
туальной памяти, наилучшим образом пригодной для реализации 
мультизадачного режима работы, завершило картину. Именно с появле- 
нием 1386 так называемые 1ВМ-совместимые компьютеры, наконец, стали 
полноценными вычислительными системами. Вместе с тем, 1386 полно- 
стью сохранил совместимость с предшествующими процессорами своей 


более дешевыми за счёт их массовости. Так или иначе, в настоящее время ситуация 
именно такова и никаких тенденций к её изменению не предвидится. 
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серии, чем обусловлена достаточно странная на первый взгляд система 
регистров. Например, универсальные регистры процессоров 8086-80286 
назывались АХ, ВХ, СХ и DX и содержали 16 бит данных каждый; в процес- 
соре 1386 и более поздних процессорах линейки имеются регистры, содер- 
жащие по 32 бита и называющиеся EAX, EBX, ECX и EDX (буква Е означает 
слово «ехфеп4еа», т.е. «расширенный»), причём младшие 16 бит каждо- 
го из этих регистров сохраняют старые названия (соответственно, АХ, ВХ, 
СХ и DX). Большинство инструкций работает по-разному для операндов 
длиной 8 бит, 16 бит и 32 бита, и т.п. 

Дальнейшее развитие семейства процессоров х86 вплоть до 2003 года 
было чисто количественным: увеличивалась скорость, добавлялись но- 
вые команды, но принципиальных изменений архитектуры не происхо- 
дило. В 2003 году компания AMD представила новый процессор, имею- 
щий 64-битные регистры, и к настоящему времени многие операционные 
системы способны выполняться на таких процессорах, однако наиболее 
популярной остаётся до сих пор именно 32-битная платформа, родона- 
чальником которой стал процессор 1386. 


$1.5. Знакомимся с инструментом 


Прежде чем написать первую самостоятельную программу на языке 
ассемблера, нам необходимо изучить процессор, с которым мы будем ра- 
ботать (пусть даже не все его возможности, но хотя бы некоторую суще- 
ственную их часть), а также синтаксис языка ассемблера. К сожалению, 
здесь возникает определённая проблема: изучать эти две вещи одновре- 
менно не получается, но, в то же время, изучать систему команд процес- 
сора, не имея никакого представления о синтаксисе языка, ассемблера, а 
равно и изучать синтаксис, не имея представления о системе команд — 
задача неблагодарная, так что, с чего бы мы ни начали, результат полу- 
чится несколько странный. Мы попробуем пойти иным путём. Некоторое 
представление о системе команд у нас уже есть, пусть даже оно весьма и 
весьма слабое; попробуем получить аналогичное представление и о син- 
таксисе языка, ассемблера, а затем уже приступим к систематическому 
изучению того и другого. 

Сейчас мы напишем работающую программу на языке ассемблера, 
оттранслируем её и запустим. Поначалу в тексте программы будет дале- 
ко не всё понятно; что-то мы объясним прямо сейчас, что-то оставим до 
более подходящего момента. Задачу мы для себя выберем очень простую: 
напечатать! пять раз слово «НеПо». Как мы уже говорили на стр. 17, 


16 Т.е. вывести на экран, или, если говорить строго, вывести в поток стандарт- 
ного вывода; отметим, что процессор сам по себе ничего не знает о выводе на экран, 
все операции ввода-вывода требуют работы с внешними устройствами и организуются 
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для вывода строки на экран, а также для корректного завершения про- 
граммы нам потребуется обращаться к операционной системе, но мы пока 
воспользуемся для этого уже готовыми макросами, которые описаны в 
отдельном файле. Ассемблер, сверяясь с этим файлом и с нашими указа- 
ниями, преобразует каждое использование такого макроса во фрагмент 
кода на языке ассемблера и сам же эти фрагменты затем оттранслирует. 
Поэтому в нашей программе будет очень мало мнемоник, обозначающих 
собственно машинные команды; в основном текст программы будет со- 
стоять из директив. Итак, пишем текст программы: 


include "stud_io.inc" 
global _start 


section .text 


_start: mov eax, 0 
again: PRINT "Hello" 
PUTCHAR 10 
inc eax 
cmp eax, 5 
jl again 
FINISH 


Попробуем теперь кое-что объяснить. Первая строчка программы содер- 
жит директиву 41пс114е; эта директива предписывает ассемблеру вста- 
вить на место самой директивы всё содержимое некоторого файла, в 
данном случае — файла stud_io.inc. Этот файл также написан на язы- 
ке ассемблера и содержит описания макросов PRINT, РОТСНАВ и FINISH, 
которые мы будем использовать для печати строки, для перехода, на сле- 
дующую строку на экране, а также для завершения программы. Таким 
образом, увидев директиву %1пс1пае,‚ ассемблер прочитает файл с onn- 
саниями макросов, в результате чего мы сможем их использовать. 

Важно отметить, что директива 41пс1а4е обязательно должна CTO- 
ять в тексте программы раньше, чем там встретятся имена макросов. 
Ассемблер просматривает наш текст сверху вниз. Изначально он ничего 
не знает о макросах и не сможет их обработать, если ему о них не со- 
общить. Просмотрев файл, содержащий описания макросов, ассемблер 
запоминает эти описания и продолжает их помнить до окончания транс- 
ляции, так что мы можем их использовать в программе — но не раньше, 
чем о них узнает ассемблер. Именно поэтому мы поставили директиву 
include в самое начало программы: теперь макросы можно использо- 
вать во всём её тексте. 


операционной системой, она же предоставляет нашей задаче абстрактные «стандарт- 
ные потоки ввода-вывода». 
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После директивы 41пс1а4е мы видим строку со словом global; это 
тоже директива, но к ней мы вернёмся чуть подзнее. 


Следующая строка программы содержит директиву section. Испол- 
няемый файл в ОС Unix устроен так, что в нём машинные команды хра- 
нятся в одном месте, а инициализированные (т. е. такие, которым прямо 
в программе задаётся начальное значение) данные — в другом, и, нако- 
нец, в третьем месте содержится информация о том, сколько программе 
потребуется памяти под неинициализированные данные. В связи с этим 
мы должны наш исполняемый код поместить в одну «секцию», описания 
областей памяти с заданным начальным значением — в другую «сек- 
цию», описания областей памяти без задания начальных значений — в 
третью «секцию». Соответствующие секции называются .text, .data и 
.Ъзз. В нашей простой программе мы обходимся только секцией .text, 
и рассматриваемая директива как раз и приказывает ассемблеру присту- 
пить к формированию этой секции. В будущем при рассмотрении более 
сложных программ нам придётся встретиться со всеми тремя секциями. 


Далее в программе мы видим строку 


_start: шоу еах, 0 


Как мы уже знаем, словом шоу обозначается команда, заставляющая 
процессор переслать некоторые данные из одного места в другое; для 
команды шоу мы всегда должны указывать два операнда, причём пер- 
вый из них будет задавать то место, куда следует скопировать данные, 
а второй операнд указывает, какие данные следует туда скопировать. В 
данном конкретном случае команда требует занести число 0 (ноль) в ре- 
гистр EAX". Значение, хранимое в регистре EAX, мы будем использовать 
в качестве счётчика цикла, то есть оно будет означать, сколько раз мы 
уже напечатали слово «Нео»; ясно, что в начале этот счётчик должен 
быть равен нулю, поскольку мы пока не напечатали ничего. 


Итак, рассматриваемая строка означает приказ процессору занести 
ноль в EAX; но что за загадочное <_start:> в начале строки? 


Слово _start (знак подчёркивания в данном случае является частью 
слова) представляет собой пример так называемых меток. Попробуем 
сначала объяснить, что такое собой представляют эти метки «вообще», 
а потом расскажем, зачем нужна метка в данном конкретном случае. 


17 Читатель, уже имеющий опыт программирования на языке ассемблера, может 
заметить, что «правильнее» это сделать совсем другой командой: хог еах, еах, по- 
скольку это позволяет достичь того же эффекта быстрее и с меньшими затратами 
памяти; однако для простейшего учебного примера такой трюк слишком сложен и 
требует неоправданно длинных пояснений. Впрочем, позже мы к этому вопросу вер- 
нёмся и обязательно рассмотрим этот и другие подобные трюки. 
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Команду mov еах,0 ассемблер преобразует в некий машинный код!8, 
который во время выполнения программы будет находиться в какой-то 
области оперативной памяти (в данном случае — в пяти ячейках, идущих 
подряд). В некоторых случаях нам нужно знать, какой адрес будет иметь 
та или иная область памяти; если говорить о командах, то знать адрес 
нам может потребоваться, например, чтобы в какой-то момент заставить 
процессор произвести в это место программы условный или безусловный 
переход (про переходы мы уже говорили, см. стр. 11). 


Конечно, мы можем использовать оперативную память и для хра- 
нения данных, а не только команд. Области памяти, предназначенные 
для данных, мы обычно называем переменными, и даём им имена по- 
чти так же, как и в привычных нам языках программирования высоко- 
го уровня. Естественно, нам требуется знать, какой адрес имеет начало 
области памяти, отведённой под переменную. Адрес, как мы уже гово- 
рили, задаётся! числом из восьми шестнадцатеричных цифр, например, 
18Ъ4а0{0. Запоминать такие числа нам неудобно, к тому же на момент 
написания программы мы ешё не знаем, в каком именно месте памяти 
в итоге окажется размещена та или иная команда или переменная. И 
здесь нам на помощь как раз и приходят метки. Метка — это вводи- 
мое программистом слово (идентификатор), с которым ассем- 
блер ассоциирует некоторое число, чаще всего — адрес в памя- 
ти. В данном случае _start как раз и есть такая метка. Если ассемблер 
видит метку перед командой (или, как мы увидим позже, директивой, 
выделяющей память под переменную), он воспринимает это как указал 
ние завести в своих внутренних таблицах новую метку и связать с ней 
соответствующий адрес, если же метка встречается в параметрах коман- 
ды, то ассемблер «вспоминает», какой именно адрес (или просто число) 
связано с данной меткой и подставляет этот адрес (число) вместо метки 
в команду. Таким образом, с меткой _start в нашей программе будет 
связано число, представляющее собой адрес ячейки, начиная с которой 
в оперативной памяти будет размещён машинный код, соответствующий 
команде шоу еах,0 (код b8 00 00 00 00). 


Важно понимать, что метки существуют только в памяти самого ас- 
семблера и только во время трансляции программы. Готовая к исполне- 
нию программа на машинном коде не будет содержать никаких меток, а 
только подставленные вместо них адреса. 


18Отметим для наглядности, что машинный код этой команды состоит из пяти 
байтов: b8 00 00 00 00, первый из которых задаёт собственно действие «поместить 
заданное число в регистр», а также и номер регистра ЕАХ. Остальные четыре байта 
задают (все вместе) то число, которое должно быть помещено в регистр; в данном 
случае это число 0. 

19 Во всяком случае, для того процессора и той системы, которые мы рассматриваем. 
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После метки мы поставили символ двоеточия. Интересно, что мы мог- 
ли бы его и не ставить. Некоторые ассемблеры отличают метки, снаб- 
женные двоеточиями, от меток без двоеточий; но наш МАЗМ к таким 
не относится. Иначе говоря, мы сами решаем, ставить двоеточие после 
метки или нет. Обычно программисты ставят двоеточия после меток, ко- 
торыми помечены машинные команды (то есть после таких меток, куда 
можно передать управление), но не ставят двоеточия после меток, по- 
мечающих данные в памяти (переменные). Поскольку метка _start как 
раз и помечает команду, после неё мы двоеточие решили поставить. 

Однако внимательный читатель может обратить внимание, что ника- 
ких переходов на метку _start в нашей программе не делается. Зачем же 
она тогда нужна? Дело в том, что слово «_зёагі» — это специальная MET- 
ка, которой помечается точка втода в программу, то есть то место 
в программе, куда операционная система должна передать управление 
после загрузки программы в оперативную память; иначе говоря, метка, 
_start обозначает то место, с которого начнётся выполнение программы. 

Вернёмся к тексту программы и рассмотрим следующую строчку: 


again: PRINT "Hello" 


Как несложно догадаться, слово again в начале строки — это ещё одна 
метка. Слово «again» по-английски означает «снова». Дело в том, что CHO- 
да нам придётся вернуться ешё четыре раза, чтобы в итоге слово Hello 
оказалось напечатано пять раз; отсюда и название метки. Стоящее далее 
в строке слово PRINT является именем макроса, а строка "Hello" — 
параметром этого макроса. Сам макрос описан, как уже говорилось, 
в файле stud_io.inc. «Увидев» имя макроса и параметр, наш ассем- 
блер подставит вместо него целый ряд команд и директив, исполнение 
которых приведёт в конечном итоге к выдаче на экран строки «Нео». 
Очень важно понимать, что PRINT не имеет никакого отношения к 
возможностям центрального процессора. Мы уже несколько раз упоми- 
нали этот факт, но тем не менее повторим ещё раз: РВІМТ — это не имя 
какой-либо команды процессора, процессор как таковой не умеет ничего 
печатать. Рассматриваемая нами строчка программы представляет собой 
не команду, а директиву, также называемую макровызовом. Повину- 
ясь этой директиве, ассемблер сформирует фрагмент текста на языке 
ассемблера (отметим для наглядности, что в данном случае этот фраг- 
мент будет состоять из 23 строк в случае применения ОС Linux и из 
15 строчек — для ОС FreeBSD) и сам же оттранслирует этот фрагмент, 
получив последовательность машинных инструкций. Эти инструкции бу- 
дут содержать, в числе прочего, и обращение к операционной системе за 
услугой вывода данных (системный вызов write). Набор макросов, вклю- 
чающий в себя и макрос PRINT, введён для удобства работы на первых 
порах, пока мы ещё не знаем, как обращаться к операционной системе. 
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Позже мы узнаем это, и тогда макросы, описанные в файле stud_io. inc, 
станут нам не нужны; более того, мы и сами научимся создавать такие 
макросы. 

Вернёмся к тексту нашего примера. Следующая строчка имеет вид 


РОТСНАН 10 


Это тоже вызов макроса, называемого РОТСНАВ и предназначенного для 
вывода на печать одного символа. В данном случае мы используем его 
для вывода символа с кодом 10; это специальный символ, обозначающий 
перевод строки, то есть при выводе этого символа на печать курсор на 
экране перейдёт на следующую строку. Обратите внимание, что в этой 
и последующих строках присутствуют только команды и макровызовы, 
а меток нет. Они нам не нужны, поскольку ни на одну из последующих 
команд мы не собираемся делать переходы, и, значит, нам не нужна ин- 
формация об адресах в памяти, где будут располагаться эти команды. 
Следующая строка в программе такая: 


inc eax 


Здесь мы видим машинную команду inc, означающую приказ увеличить 
заданный регистр на 1. В данном случае увеличивается регистр EAX. Ha- 
помним, что в регистре ЕАХ мы условились хранить информацию о том, 
сколько раз уже напечатано слово «НеПо». Поскольку выполнение двух 
предыдущих строчек программы, содержащих вызовы макросов PRINT 
и РОТСНАВ, привело в конечном счёте как раз к печати слова «НеПо», 
следует отразить этот факт в регистре, что мы и делаем. Отметим, что 
машинный код этой команды оказывается очень коротким — всего один 
байт (шестнадцатеричное 40, десятичное 64). 
Далее в нашей программе идёт команда сравнения: 


сшр еах, 5 


Машинная команда сравнения двух целых чисел обозначается мнемони- 
кой cmp от английского «фо compare» — сравнивать. В данном случае 
сравниваются содержимое регистра ЕАХ и число 5. Результаты сравне- 
ния записываются в специальный регистр процессора, называемый ре- 
гистром флагов. Это позволяет, например, произвести условный пере- 
тод в зависимости от результатов предшествующего сравнения, что мы 
в следующей строчке программы и делаем: 


jl again 


Здесь jl (от слов <Jump if Lower») — это мнемоника для машинной KO- 
манды условного перехода, который выполняется в случае, если предше- 
ствующее сравнение дало результат «первый операнд меньше второго», 
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то есть, в нашем случае, если число в регистре ЕАХ оказалось меньше, 
чем 5. В терминах нашей задачи это означает, что слово «Нео» было 
напечатано меньше пяти раз и, стало быть, необходимо продолжать его 
печатать, что и делается переходом (передачей управления) на коман- 
ду, помеченную меткой ара1п. 

Если результат сравнения был любым другим, кроме «меньше», ко- 
манда )1 не произведёт никаких действий, и процессор, таким образом, 
перейдёт к выполнению следующей по порядку команды. Это произой- 
дёт в случае, если слово «НеПо» уже было напечатано 5 раз, так что цикл 
пора заканчивать. После окончания цикла наша исходная задача оказы- 
вается решена, и, стало быть, программу тоже пора завершать. Для этого 
и предназначена, следующая строка программы: 


FINISH 


Слово FINISH тоже обозначает макрос; этот макрос разворачивается B NO- 
следовательность команд, осуществляющих обращение к операционной 
системе с просьбой завершить выполнение нашей программы. 

Нам осталось вернуться к началу программы и рассмотреть строку 


global _start 


Слово global — это директива, которая требует от ассемблера считать 
некоторую метку «глобальной», то есть как бы видимой извне (если го- 
ворить строго, видимой извне объектного модуля; это понятие мы бу- 
дем рассматривать позднее). В данном случае «глобальной» объявляется 
метка _start. Как мы уже знаем, это специальная метка, которой поме- 
чается точка входа в программу, то есть то место в программе, куда 
операционная система должна передать управление после загрузки про- 
граммы в оперативную память. Ясно, что эта метка должна быть видна 
извне, что и достигается директивой global. 

Итак, наша программа состоит из трёх частей: подготовки, цикла, на- 
чало которого отмечено меткой again, и завершающей части, состоящей 
из одной строчки FINISH. Перед началом цикла мы заносим в регистр 
EAX число 0, затем на каждой итерации цикла печатаем слово «Нео», 
делаем перевод строки, увеличиваем на единицу содержимое регистра 
ЕАХ, сравниваем его с числом 5; если в регистре ЕАХ всё ещё содержится 
число, меньшее пяти, переходим снова к началу цикла (то есть на метку 
again), в противном случае выходим из цикла и завершаем выполнение 
программы. 

Чтобы попробовать приведённую программу, как говорится, в деле, 
необходимо войти в систему Unix, вооружиться каким-нибудь редакто- 
ром текстов, набрать вышеприведённую программу и сохранить её в фай- 
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20 на .азш — именно так обычно называют 


ле с именем, заканчивающимся 
файлы, содержащие исходный текст на языке ассемблера. 

Допустим, мы сохранили текст программы в файле hello5.asm. Для 
получения исполняемого файла нам необходимо выполнить два дей- 
ствия. Первое — это вызов ассемблера МАЗМ, который, используя за- 
данный нами исходный текст, построит обвектный модуль. Объектный 
модуль — это ещё не исполняемый файл; дело в том, что большие про- 
граммы обычно состоят из целого набора исходных файлов, называемых 
модулями, плюс к тому мы можем захотеть воспользоваться чьими- 
то сторонними подпрограммами, объединёнными в библиотеки. Таким 
образом, нам нужно будет соединить несколько модулей воедино и под- 
ключить к ним библиотеки; этим занимается системный компонов- 
WUK, также называемый иногда редактором связей или линкером. 

Наша примерная программа состоит всего из одного модуля и не нуж- 
дается ни в каких библиотеках, но стадии сборки (компоновки) это не 
исключает. Это и есть второе действие, необходимое для построения ис- 
полняемого файла: небходимо вызвать компоновщик, чтобы он нам из 
объектного файла построил файл исполняемый. Как раз на этой стадии 
будет использована метка _start; мы можем уточнить, что директива 
global не просто делает метку «видимой извне», а заставляет ассемблер 
вставить в объектный файл информацию об этой метке, видимую для 
компоновщика. 

Итак, для начала вызываем ассемблер МАЅМ: 


nasm -f elf һе1105.аѕт 


Флажок «-# elf» указывает ассемблеру, что на выходе мы ожидаем объ- 
ектный файл в формате ELF — именно этот формат используется в Ha- 
шей системе для исполняемых файлов?!. Результатом запуска ассембле- 
ра станет файл ве1105.0, содержащий объектный модуль. Теперь мы 
можем запустить компоновщик, который называется 14: 


ld һе11о5.о -o Һе1105 


Если вы работаете под управлением 64-битной операционной системы, придёт- 
ся добавить ещё один ключ для компоновщика, чтобы тот произвёл сборку 32- 
битного исполняемого файла; в частности, для GNU 14 под Linux это будет Bbi- 
глядеть так: 


20 Работая в системе семейства Windows, мы, возможно, сказали бы, что .asm — 
это «расширение» файла. В ОС Unix понятие «расширения» обычно не используется, 
вместо него мы говорим, что имя заканчивается на .аѕт или что имя имеет суффикс 
.asm. 

219то верно по крайней мере для современных версий операционных систем Linux 
и FreeBSD. В других системах вам может потребоваться другой формат объектных и 
исполняемых файлов; сведения об этом обычно есть в технической документации. 
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ld -m е1#_1386 Һе11о5.о -o Һе1105 


Флажком -O мы задали имя исполняемого файла (ве11о5, на этот раз 
без суффикса). Запустим его на исполнение, дав команду «./ће1105». 
Если мы нигде не ошиблись, мы увидим пять строчек Не11о. 


$ 1.6. Макросы из файла stud_io.inc 


Макросы, описанные в файле зоа _іо.іпс, нам неоднократно потре- 
буются в дальнейшем, поэтому, чтобы не возвращаться к ним, ещё раз 
приведём описание их возможностей. Текст файла stud_io.inc (версии 
для Linux и FreeBSD) приведён в приложении А, так что при желании 
вы легко поймёте, как устроены эти макросы. В программе, которую мы 
разобрали в предыдущем параграфе, мы использовали макросы РВІМТ, 
РОТСНАВ и FINISH. Кроме этих трёх макросов наш файл stud_io.inc 
поддерживает ещё макрос СЕТСНАВ, так что всего этих макросов четыре. 

Макрос PRINT предназначен для печати строки; его аргументом долж- 
на быть строка в апострофах или двойных кавычках, ничего другого он 
печатать не умеет. 

Макрос РОТСНАВ предназначен для вывода на печать одного символа. 
В качестве аргумента он принимает код символа, записанный в виде чис- 
ла или в виде самого символа, взятого в кавычки или апострофы; также 
можно в качестве аргумента этого макроса использовать однобайтовый 
регистр — AL, АН, BL, ВН, CL, СН, DL или ОН. Использовать другие pe- 
гистры в качестве аргумента РОТСНАВ нельзя! Наконец, аргументом 
этого макроса может выступать исполнительный адрес, заключённый в 
квадратные скобки — в этом случае код символа будет взят из ячейки 
памяти по этому адресу. 

Макрос СЕТСНАВ считывает символ из потока стандартного ввода (с 
клавиатуры). После считывания код символа записывается в регистр 
ЕАХ; поскольку код символа всегда умещается в один байт, его можно 
извлечь из регистра AL, остальные разряды EAX будут равны нулю. Ec- 
ли символов больше нет (достигнута так называемая ситуация кониа 
файла, которая в ОС Unix обычно имитируется нажатием Ctrl-D), в EAX 
будет занесено значение -1 (шестнадцатеричное ЕЕЕЕЕЕЕЕ, то есть все 32 
разряда регистра равны единицам). Никаких параметров этот макрос не 
принимает. 

Макрос FINISH завершает выполнение программы. Этот макрос MOX- 
но вызвать без параметров, а можно вызвать с одним числовым парамет- 
ром, задающим так называемый код завершения процесса; обычно 
используют код 0, если наша программа отработала успешно, и код 1, 
если в пропессе работы возникли ошибки. 
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Глава 2. Процессор 1386 


$2.1. Система регистров 1386 


Регистром называют электронное устройство в составе централь- 
ного процессора, способное содержать в себе определённое количество 
данных в виде двоичных разрядов. В большинстве случаев (но не всегда) 
содержимое регистра трактуется как целое число, записанное в двоичной 
системе счисления. Регистры процессора 1386 можно условно разделить 
на регистры общего назначения, сегментиные регистры и Cne- 
циальные регистры. Каждый регистр имеет своё название!, состоя- 


щее из двух-трёх латинских букв. 


Сегментные регистры (CS, DS, SS, ES, GS и FS) в «плоской» модели 
памяти не используются. Точнее говоря, перед передачей управления 
пользовательской задаче операционная система заносит в эти регистры 
некоторые значения, которые задача теоретически может изменить, но 
ничего хорошего из этого всё равно не выйдет — скорее всего, произой- 
дёт аварийное завершение. Таким образом, мы принимаем во внимание 
существование этих регистров, но более к ним возвращаться не будем. 


Регстры общего назначения процессора, 1386 — это 32-битные реги- 
стры EAX, EBX, ECX, EDX, ESI, EDI, ЕВР и ESP. Как уже отмечалось на 
стр. 24, буква Е в названии этих регистров означает слово «ех{епае4», 
подчёркивая тот факт, что в их современном виде эти регистры появи- 
лись только в процессоре 1386. Для совместимости с предыдущими про- 
цессорами семейства х86 каждый 32-битный регистр имеет обособленную 
младшую половину (младшие 16 бит), имеющую отдельное название, по- 
лучаемое отбрасыванием буквы Е, то есть, иначе говоря, мы можем ра- 
ботать также с 16-битными регистрами АХ, ВХ, СХ, DX, SI, р, ВР и $Р, 
которые представляют собой младшие половины соответствующих 32- 
битных регистров. 


Этим процессоры семейства X86 отличаются от многих других процессоров, в KO- 
торых регистры имеют номера. 
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Рис. 2.1. Система регистров 1386 


Кроме того, регистры АХ, ВХ, СХ и DX также делятся на младшие и 
старшие части, теперь уже восьмибитные. Так, для регистра АХ его млад- 
ший байт имеет также название AL, а старший байт — АН (от слов «10%» и 
<high»). Аналогично мы можем работать с регистрами BL, ВН, CL, СН, DL 
и DH, которые представляют собой младшие и старшие байты регистров 
ВХ, СХ и DX. Остальные регистры общего назначения таких обособленных 
однобайтовых подрегистров не имеют. 

Каждый из регистров общего назначения, несмотря на такое название, в неко- 
торых случаях играет специфическую, только ему присущую роль, частично за- 
кодированную в имени регистра. Так, в имени регистра АХ буква А обозначает 
слово «accumulator»; на многих архитектурах, включая знаменитый IAS Джона 
фон Неймана, аккумулятором называли регистр, участвующий (по определению) 
во всех арифметических операциях, во-первых, в качестве одного из операндов, 
и, во-вторых, в качестве места, куда следует поместить результат. Связанная с 
этим особая роль регистров АХ и ЕАХ проявляется в командах целочисленного 
умножения и деления (см. $ 2.3.4). 

В имени регистра ВХ буква В обозначает слово «Базе», но никакой особой роли 
в 32-битных процессорах этому регистру не отведено (хотя в 16-битных процессо- 
рах такая роль существовала). 

В имени СХ буква С обозначает слово «counter» (счётчик). Регистры ЕСХ, СХ, 
а в некоторых случаях даже CL используются во многих машинных командах, 
предполагающих (в том или ином смысле) определённое количество итераций. 

Имя регистра DX символизирует слово «data» (данные). В особой роли регистр 
EDX (или ОХ, если выполняется шестнадцатиразрядная операция) выступает при 
выполнении операций целочисленного умножения (для хранения части результа- 
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та, не поместившейся в аккумулятор) и целочисленного деления (для хранения 
старшей части делимого, а после выполнения операции — для хранения остатка 
от деления). 


Имена регистров SI и DI означают, соответственно, «source іпаех» и 
«destination index» (индекс источника и индекс назначения). Регистры ESI и EDI 
используются в командах, работающих с массивами данных, причём ЕЅІ хранит 
адрес текущей позиции в массиве-источнике (например, в области памяти, кото- 
рую нужно куда-то скопировать), а ЕРТ хранит адрес текущей позиции в массиве- 
цели (в области памяти, куда производится копирование). 


Имя регистра ВР обозначает «Базе pointer» (базовый указатель). Как правило, 
регистр ЕВР используется для хранения базового адреса стекового фрейма при 
вызове подпрограмм, имеющих параметры и локальные переменные. 


Наконец, имя регистра SP обозначает «stack ро!пїег» (указатель стека). 
Несмотря на принадлежность регистра ESP к группе регистров общего назначения, 
в реальности он всегда используется именно в качестве указателя стека, то есть 
хранит адрес текущей позиции вершины аппаратного стека. Поскольку обойтись 
без стека тяжело, а другие регистры для этой цели не подходят, можно считать, 
что ESP никогда не выступает ни в какой иной роли. 


К регистрам специального назначения мы отнесём регистр счёт- 
чика команд EIP и регистр флагов FLAGS. 


Регистр EIP, имя которого образовано от слов «extended instruction 
pointer», хранит в себе адрес в оперативной памяти, по которому NPO- 
цессору следует извлечь следующую машинную инструкцию, предназна- 
чентую к выполнено. После извлечения инструкции из памяти значение 
в регистре ЕТР автоматически увеличивается на длину прочитанной ин- 
струкции (отметим, что инструкция может занимать в памяти от одной 
до одиннадцати идущих подряд ячеек), так что регистр снова содержит 
адрес команды, которую нужно выполнить следующей. Как и для реги- 
стров общего назначения, младшая половина регистра ЕТР имеет имя ТР, 
однако использовать его, работая под управлением 32-битной операци- 
онной системы, мы всё равно никак не сможем. 


Регистр флагов FLAGS — единственный из рассматриваемых нами pe- 
гистров, который очень редко используется как единое целое, и вовсе 
никогда не рассматривается как число. Вместо этого каждый двоичный 
разряд (бит) этого регистра представляет собой флаг, имеющий соб- 
ственное имя. Некоторые из этих флагов процессор сам устанавливает в 
ноль или единицу в зависимости от результата очередной выполненной 
команды; другие флаги устанавливаются в явном виде соответствующи- 
ми инструкциями и в дальнейшем влияют на ход выполнения некоторых 
команд. В частности, флаги используются для выполнения условных 
переходов: некоторая команда выполняет арифметическую или другую 
операцию, а следующая прямо за ней команда передаёт управление в 
другое место программы, но только в случае, если результат предыду- 


35 


шей операции удовлетворяет тем или иным условиям; условия как раз и 
проверяются по установленным флагам. Перечислим некоторые флаги: 


e ZF — флаг нулевого результата (zero Нар). Этот флаг устанавли- 
вается в ходе выполнения арифметических операций и операций 
сравнения: если в результате операции получился ноль, ZF устанав- 
ливается в единицу. 


e СГ — флаг переноса (carry Нар). После выполнения арифметиче- 
ской операции над беззнаковыми числами этот флаг выставляет- 
ся в единицу, если потребовался перенос из старшего разряда, то 
есть результат не поместился в регистр, либо потребовался заём из 
несуществующего разряда при вычитании, то есть вычитаемое ока- 
залось больше, чем уменьшаемое (см. § 1.3.1). В противном случае 
флаг выставляется в ноль. 


e ЅЕ — флаг знака (sign flag). Устанавливается равным старшему биту 
результата, который для знаковых чисел соответствует знаку числа 
(см. стр. 21). 


e ОГ — флаг переполнения (overflow Нар). Выставляется в единицу, 
если при работе со знаковыми числами произошло переполнение 
(см. стр.21). 


e DF — флаг направления (direction Нар). Этот флаг можно устано- 
вить командой STD и обнулить командой CLD; в зависимости от его 
значения строковые операции, которые мы будем рассматривать 
несколько позже, выполняются в прямом или в обратном направ- 
лении. 


e PF и АЕ — флаг чётности (parity flag) и флаг полупереноса (auxiliary 
сатгу Нар). Нам эти флаги не потребуются. 


e ТЕ и ТЕ — флаги разрешения прерываний (interrupt Нар) и ловушки 
(trap Нар). Эти флаги нам недоступны, их можно изменять только 
в привилегированном режиме. 


На самом деле такой набор флагов существовал до процессора 1386; при переходе 
к процессору 1386 регистр флагов, как и все остальные регистры, увеличился в 
размерах и превратился в регистр EFLAGS, но все новые флаги нам в ограниченном 
режиме недоступны, так что рассматривать их мы не будем. 
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$2.2. Память, регистры и команда тоу 


$ 2.2.1. Память пользовательской задачи. Секции 


Ясно, что регистров центрального процессора заведомо не хватит для 
хранения всей информации, нужной в любой более-менее сложной про- 
грамме. Поэтому регистры используются лишь для краткосрочного хра- 
нения промежуточных результатов, которые вот-вот понадобятся снова. 
Кроме регистров, программа может воспользоваться для хранения ин- 
формации оперативной памятью. 

Один из основополагающих принципов, определяющих архитектуру 
фон Неймана, состоит в однородности памяти: и сама программа 
(то есть составляющие её машинные команды), и все данные, с которы- 
ми она работает, располагаются в ячейках памяти, одинаковых по своему 
устройству и имеющих адреса, из единого адресного пространства. В на- 
шем случае каждая ячейка памяти способна хранить ровно один байт и 
имеет свой уникальный адрес — число из 32 бит (речь идёт, естественно, 
о виртуальных адресах, которые мы обсуждали на стр. 16). 

Несмотря на то, что физически все ячейки памяти абсолютно оди- 
наковы, операционная система может установить для пользовательской 
задачи разные возможности по доступу к различным областям памяти. 
Это достигается средствами аппаратной защиты памяти, которые мы 
уже упоминали. В частности, некоторые области памяти могут быть до- 
ступны задаче только для чтения, но не для изменения находящейся там 
информации; кроме того, не всякую область памяти разрешается рас- 
сматривать как машинный код (то есть заносить адреса ячеек из этой 
области в регистр счётчика команд). Если задаче позволено рассматри- 
вать содержимое области памяти как фрагмент исполняемой машинной 
программы, говорят, что область памяти доступна на исполнение; 
область памяти, содержимое которой задача может модифицировать, на- 
зывают доступной на запись. Часто можно встретить также термин 
доступ на чтение, но в применении к оперативной памяти отсутствие 
этого вида доступа обычно означает отсутствие какого-либо доступа, во- 
обще. 

Обычно современные операционные системы выстраивают виртуаль- 
ное адресное пространство пользовательской задачи, разделив его на че- 
тыре основные секции. Первая из этих секций, называемая секцией 
кода, создаётся для хранения исполняемого машинного кода, из которо- 
го, собственно говоря, и состоит исполняемая программа. Естественно, 
область памяти, выделенная под секцию кода, доступна задаче на испол- 
нение. С другой стороны, операционная система не позволяет поль- 
зовательским задачам модифицировать содержимое секции ко- 
да; попытка, задачи сделать такую модификацию рассматривается как 
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нарушение защиты памяти. Сделано это по достаточно простой причине: 
если в системе одновременно запущено в виде задач несколько экземпля- 
ров одной и той же программы, операционная система обычно хранит в 
физической памяти только один экземпляр машинного кода, такой про- 
граммы. Это верно даже в случае, если запущенные задачи принадлежат 
разным пользователям и имеют разные полномочия в системе. Если одна 
из таких задач модифицирует «свою» секцию кода, очевидно, что это по- 
мешает работать остальным — ведь они используют (физически) ту же 
самую секцию кода. Однако на чтение секция кода доступна, так что её 
можно использовать не только для кода как такового, но и для хранения 
константных данных — такой информации, которая не изменяется во 
время выполнения программы. В программах секция кода обозначается 
<.text» (точка перед названием секции обязательна и является частью 
названия). 


Вторая и третья секции, имеющие собирательное название сегмент 
данных, предназначены для хранения глобальных и динамических Te- 
ременных. Обе эти секции доступны задаче как на чтение, так и на за- 
пись; с другой стороны, операционная система обычно запрещает переда- 
чу управления внутрь этих секций, чтобы несколько затруднить «взлом» 
компьютерных программ. Первая из двух секций называется собствен- 
но секцией данных, в программах обозначается <.data?» и содержит 
инициализированные данные, то есть такие глобальные переменные, для 
которых в программе задано начальное значение. Вторая секция из сег- 
мента данных называется секцией неиниииализированных данныт 
или секцией BSS? и обозначается <.bss»; как ясно из названия, эта 
секция предназначена для переменных, для которых начальное значение 
не задано. Секция В55 отличается от секции данных двумя особенностя- 
ми. Во-первых, поскольку содержимое секции данных на, момент старта 
программы должно быть таким, как это задано программой, её образ 
необходимо хранить в исполняемом файле программы; для секции BSS в 
исполняемом файле достаточно хранить только размер. Во-вторых, сек- 
ция BSS может во время работы программы увеличиваться в размерах, 
что позволяет создавать новые переменные на этапе выполнения. 

Память, получаемую во время работы программы, обычно называют динами- 
ческой памятью или кучей (heap). В нашем курсе мы не будем рассматривать 
работу с динамической памятью, но для любознательных читателей сообщим, что 
в ОС Ипих выделение дополнительной памяти производится системным вызовом 
brk, о котором можно узнать из технической документации по ядру. Выделение 
дополнительной памяти в ОС FreeBSD производится средствами системного Bbl- 


2Пафа (англ.) — данные; читается «дэйта». 

3 Исторически аббревиатура BSS обозначала Block Started by Symbol, что было обу- 
словлено особенностями одного старого ассемблера. В настоящее время программисты 
предпочитают расшифровывть BSS как Blank Static Storage. 


38 


зова mmap, который, к сожалению, гораздо сложнее, особенно для использования 
в программах на языке ассемблера. 

Четвёртая основная секция — это так называемая секция стека; она, 
нужна для хранения локальных переменных в подпрограммах и адресов 
возврата из подпрограмм. Подробный рассказ о стеке у нас ещё впере- 
ди, пока мы только отметим, что эта секция также доступна на запись; 
доступность её на исполнение зависит от конкретной операционной си- 
стемы и даже от конкретной версии ядра: например, в большинстве вер- 
сий Linux в секцию стека можно передавать управление, но специальный 
«патч» к исходным текстам ядра эту возможность устраняет. Эта секция 
также может увеличиваться в размерах по мере необходимости, причём 
это происходит автоматически (в отличие от увеличения секции BSS, Ko- 
торое необходимо затребовать от операционной системы явно). Секция 
стека присутствует в пользовательской задаче всегда, её исходное содер- 
жимое зависит только от параметров запуска программы, а дальше она 
изменяется по мере необходимости. Никакой информации о секции сте- 
ка исполняемый файл не содержит. Во время написания программы мы 
не можем никак повлиять на секцию стека, так что ассемблер не имеет 
никакого специального обозначения для неё. 


$ 2.2.2. Директивы для отведения памяти 


Содержимое этого параграфа не имеет прямого отношения к архитектуре про- 
цессора 1386; здесь мы рассмотрим директивы, являющиеся особенностью кон- 
кретного ассемблера. Дело, однако, в том, что нам очень сложно будет обойтись 
без них при изучении дальнейшего материала. 

Написанные нами условные обозначения машинных команд ассем- 
блер транслирует в некий образ области памяти — массив чисел (дан- 
ных), которые нужно будет записать в смежные ячейки оперативной па- 
мяти. Затем при запуске программы в эту область памяти будет переда- 
но управление (то есть, попросту говоря, адрес какой-то из этих ячеек 
будет записан в регистр ЕТР) и центральный процессор начнёт выпол- 
нение нашей программы, используя числа из созданного ассемблером 
образа в качестве кодов команд. Если мы пишем программу, которая 
будет потом выполняться в качестве задачи под управлением многоза- 
дачной операционной системы, то при загрузке исполняемого файла в 
память операционная система сформирует секцию кода (секцию .text) 
соответствующего размера и именно в ней расположит машинный код 
нашей программы, то есть, попросту, скопирует в неё записанный в ис- 
полняемом файле образ памяти. 

Аналогично можно использовать ассемблер и для создания образа 
области памяти, содержащей данные, а не команды. Для этого нужно 
сообщить ассемблеру, сколько памяти нам необходимо под те или иные 
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нужды, и при этом, возможно, задать те значения, которые в эту память 
будут помещены перед стартом программы. 

Пользуясь нашими указаниями, ассемблер соответствующим образом 
сформирует отдельно образ памяти, содержащий команды (образ секции 
.text), и отдельно образ памяти, содержащий инициализированные дан- 
ные (образ секции .даба), а кроме того, сосчитает, сколько нам нужно 
такой памяти, о начальном значении которой мы не беспокоимся и для 
которой, соответственно, не нужно формировать образ, а нужно лишь 
указать её количество (размер секции .bss). Всё это ассемблер запишет 
в файл с объектным кодом, а системный компоновщик из таких фай- 
лов (возможно, нескольких) сформирует исполняемый файл, содержа- 
щий (кроме собственно машинного кода), во-первых, те данные, которые 
нужно записать в память перед стартом программы, и, во-вторых, ука- 
зания на то, сколько программе понадобится ещё памяти, кроме той, что 
нужна под размещение машинного кода и исходных данных. Чтобы со- 
общить ассемблеру, в какой секции должен быть размещён тот или иной 
фрагмент формируемого образа, памяти, мы в программе на языке ас- 
семблера должны использовать директиву section; например, строчка 


section .text 


означает, что результат обработки последующих строк должен разме- 
шаться в секции кода, а строчка 


section .bss 


заставляет ассемблер перейти к формированию секции неинициализиро- 
ванных данных. Директивы переключения секций могут встречаться в 
программе сколько угодно раз — мы можем сформировать часть одной 
секции, затем часть другой, потом вернуться к формированию первой. 

Сообщить ассемблеру о наших потребностях в оперативной памяти 
можно с помощью директив резервирования памяти, которые де- 
лятся на два вида: директивы резервирования неинициализированной 
памяти и директивы задания исходных данных. Обычно перед дирек- 
тивами обоих видов ставится метка, чтобы можно было ссылаться с её 
помощью на адрес в памяти, где ассемблер отвёл для нас требуемые 
ячейки. 

Директивы резервирования неинициализированной памяти 
сообщают ассемблеру, что необходимо зарезервировать заданное коли- 
чество ячеек памяти, причём ничего, кроме количества, не уточняется. 
Мы не требуем от ассемблера заполнять отведённую память какими- 
либо конкретными значениями, нам достаточно, чтобы эта память во- 
обще была в наличии. Для резервирования заданного количества одно- 
байтовых ячеек используется директива resb, для резервирования Na- 
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MATH под определённое количество «слов“», то есть двутбайтювых знал 


чений (например, коротких целых чисел) — директива гези, для «двой- 
ных слов» (то есть четырёхбайтных значений) используется геза; после 
директивы указывается (в качестве параметра) число, обозначающее ко- 
личество значений, под которое мы резервируем память. Как уже говори- 
лось, обычно перед директивой резервирования памяти ставится метка. 
Например, если мы напишем следующие строки: 


string resb 20 
count resw 256 
ре геѕа 1 


то по адресу, связанному с меткой string, будет расположен массив из 20 
однобайтовых ячеек (такой массив можно, например, использовать для 
хранения строки символов); по адресу count ассемблер отведёт массив 
из 256 двубайтных «слов» (т.е. 512 ячеек), которые можно использовать, 
например, для каких-нибудь счётчиков; наконец, по адресу х будет рас- 
полагаться одно «двойное слово», то есть четыре байта памяти, которые 
можно использовать для хранения достаточно большого целого числа. 

Директивы второго типа, называемые директивами задания ис- 
ходных данных, не просто резервируют память, а указывают, какие 
значения в этой памяти должны находиться к моменту запуска програм- 
мы. Соответствующие значения указываются после директивы через за- 
пятую; памяти отводится столько, сколько указано значений. Для 3a- 
дания однобайтовых значений используется директива аЬ, для задания 
«слов» — директива аы и для задания «двойных слов» — директива аа. 
Например, строка 


fibon dw 1, 1, 2, 3, 5, 8, 13, 21 


зарезервирует память под восемь двубайтных «слов» (то есть всего 16 
байт), причём в первые два «слова» будет занесено число 1, в третье 
слово — число два, в четвёртое — число 5 и т. д. С адресом первого байта, 
отведённой и заполненной таким образом памяти будет ассоциирована 
метка fibon. 

Числа можно задавать не только в десятичном виде, но и в шестна- 
дцатеричном, восьмеричном и двоичном. Шестнадцатеричное число в ас- 
семблере МАЗМ можно задать тремя способами: прибавив в конце числа, 
букву h (например, 2af3h), либо написав перед числом символ $ ($2а+3), 


4 Напомним, что такая терминология не совсем корректна, поскольку термином 
«слово» должна обозначаться порция информации, обрабатываемая процессором за 
один приём; начиная с 1386, размер машинного слова на этих процессорах составлял 
четыре байта, а не два. Использование термина мога в ассемблерах для обозначения 
двухбайтовых значений — пережиток тех времён, когда машинное слово составляло 
два байта. 
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либо поставив перед числом символы 0х, как в языке Си (0х2а#З). При 
использовании символа $ необходимо следить, чтобы сразу после $ стоя- 
ла цифра, а не буква, так что если число начинается с буквы, необходи- 
мо добавить 0 (например, $0#9 вместо просто $#9). Аналогично нужно 
следить за первым символом и при использовании буквы Ъ: например, 
а21һ ассемблер воспримет как идентификатор, а не как число. Чтобы 
избежать проблемы, следует написать 0а21һ. С другой стороны, с чис- 
лом 2fah такой проблемы изначально не возникает, поскольку первый 
символ в его записи является цифрой. Восьмеричное число обозначается 
добавлением после числа буквы о или q (например, 6340, 7544). Наконец, 
двоичное число обозначается буквой Ъ (10011011Ъ). 


Отдельного упоминания заслуживают коды символов и текстовые 
строки. Для работы с текстовыми данными каждому символу приписы- 
вается код символа — небольшое целое положительное число. Таблица, 
ставящая каждому символу в соответствие его код, называется коди- 
ровкой символов. Все современные компьютерные системы использу- 
ют кодировку ASCII для представления латинских букв, а также цифр, 
знаков препинания и некоторых других символов. Например, код заглав- 
ной латинской буквы «А» в кодировке ASCII равен 65, код цифры «0» 
(ноль) — число 48, код знака «+» (плюс) — 43, а код пробела, — 32. Тек- 
стовые данные могут содержать также «специальные символы», которые 
не отображаются в виде символов, а обозначают свойства, текста; напри- 
мер, символ с кодом 10 обозначает перевод строки, то есть при его выводе 
на экран курсор на экране перейдёт на следующую строку. Кодировка 
АЅСП использует числа от 1 до 127, так что для хранения одного символа 
оказывается заведомо достаточно одной однобайтовой ячейки памяти?. 
Для хранения строк символов обычно используются массивы однобайто- 
вых ячеек, в каждой из которых содержится код очередного символа. 

Чтобы программисту не нужно было запоминать коды, соответству- 
ющие печатным символам (буквам, цифрам и т. п.), вместо кода можно 
написать сам символ, взяв его в апострофы или двойные кавычки. Так, 
директива, 


#127 а 7? 


5 Отметим, что в таблицу ASCII не входят буквы никаких алфавитов, кроме латин- 
ского — ни русские (кириллические) буквы, ни греческие, ни даже латинские буквы с 
диакритическими знаками, такие как немецкая «а» или шведская А, не имеют своего 
кода в АЗСП-таблице. К представлению символов, не вошедших в ASCII, возможно 
много различных подходов: иногда их кодируют числами от 128 до 255, что позво- 
ляет по-прежнему уместить каждый символ в один байт, но не позволяет сочетать 
несколько разных алфавитов (например, кириллица вместе с греческими буквами в 
отведённое пространство кодов не поместятся, не говоря уже об иероглифах); иногда, 
(особенно в последние годы) используют многобайтные кодировки, в которых один 
символ может занимать два, три или четыре байта. 
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разместит в памяти байт, содержащий число 55 — код символа «семёрки», 
а, адрес этой ячейки свяжет с меткой #157. Мы можем написать и сразу 
целую строку, например, вот так: 


welmsg db ’Ме1соше to Cyberspace!’ 


В этом случае по адресу welmsg будет располагаться строка из 16 симво- 
лов (то есть массив однобайтовых ячеек, содержащих коды соответству- 
ющих символов). Как уже было сказано, кавычки можно использовать 
как одинарные (апострофы), так и двойные, так что следующая строка 
полностью аналогична предыдущей: 


welmsg db "Welcome to Cyberspace!" 


Внутри двойных кавычек апострофы рассматриваются как обычный 
символ; то же самое можно сказать и о символе двойных кавычек внут- 
ри одинарных. Например, фразу «бо І say: "Don’t рапіс!"» можно 
задать следующим образом: 


panic db бо І say: "Боп?, "?", 26 рап1с"? 


Здесь мы сначала воспользовались апострофом в качестве символа, оди- 
нарных кавычек, так что символ двойных кавычек, обозначающий пря- 
мую речь, вошел в нашу строку как обычный символ. Затем, когда нам 
в строке потребовался апостроф, мы закрыли одинарные кавычки и вос- 
пользовались двойными, чтобы набрать символ апострофа. Наконец, мы 
снова воспользовались апострофами, чтобы задать остаток нашей фра- 
зы, включая и заканчивающий прямую речь символ двойных кавычек. 

Отметим, что строками в одинарных и двойных кавычках можно пользоваться 
не только с директивой db, но и с директивами dw и dd, однако при этом необхо- 
димо учитывать некоторые тонкости, которые мы рассматривать не будем. 

При написании программ обычно директивы задания исходных дан- 
ных располагают в секции .data (то есть перед описанием данных ставят 
директиву section .даба), а директивы резервирования памяти выде- 
ляют в секцию .bss. Это обусловлено уже упоминавшимся различием 
в их природе: инициализированные данные нужно хранить в исполняе- 
мом файле, тогда как для неинициализированных достаточно указать их 
общее количество. Секция .bss, как мы помним, как раз и отличается 
от .data тем, что в исполняемом файле от неё хранится только указа- 
ние размера; иначе говоря, размер исполняемого файла не зависит от 
размера секции .bss. Так, если мы добавим в секцию .да+а директиву 


db "This is а string" 


то размер исполняемого файла увеличится Ha 16 байт (надо же где-то 
хранить строку "This is а string"), тогда как если мы добавим в CEK- 
цию .bss директиву 
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геза 16 


размер исполняемого файла, вообще никак не изменится, несмотря на то, 
что памяти выделяется ровно столько же. 

Расположить директивы задания исходных данных мы можем и в секции кода 
(секции .text), нужно только помнить, что тогда эти данные нельзя будет из- 
менить во время работы программы. Но если в нашей программе есть большой 
массив, который не нужно изменять (какая-нибудь таблица констант, а чаще — 
некий текст, который наша программа должна напечатать), выгоднее разместить 
эти данные именно в секции кода, ведь если пользователи запустят одновременно 
много экземпляров нашей программы, секция кода у них будет одна на всех и мы 
сэкономим память. Ясно, что такая экономия возможна только для неизменяе- 
мых данных. Помните, что попытка изменить во время выполнения содержимое 
секции кода приведёт к аварийному завершению программы! 

Ассемблер позволяет использовать любые команды и директивы в любых сек- 
циях. В частности, мы можем в секцию данных поместить машинные команды, 
и они будут, как обычно, оттранслированы в соответствующий машиный код, но 
передать управление на этот код мы не сможем. Всё же в некоторых экзотических 
случаях такое может иметь смысл, поэтому ассемблер молча выполнит наши ука- 
зания. Встретив директивы резервирования памяти (resb, resw и др.) в секции 
„даа, ассемблер тоже сделает своё дело, но в этом случае будет всё же выдано 
предупреждающее сообщение; действительно, ситуация несколько странная, по- 
скольку без всякого толка увеличивает размер исполняемого файла, хотя и не 
приводит ни к каким фатальным последствиям. Ещё более странно будут выгля- 
деть директивы резервирования неинициализированной памяти в секции кода: 
действительно, если начальное значение не задано, а изменить эту память мы не 
можем — значит, никакое осмысленное значение в такую память никогда не попа- 
дёт, и какой в таком случае от неё толк?! Тем не менее, ассемблер и в этом случае 
продолжит трансляцию, выдав только предупреждающее сообщение. Предупре- 
ждение будет выдано также и в случае, если в секции BSS встретится что-нибудь 
кроме директив резервирования неинициализированной памяти: ассемблер точно 
знает, что сформированный для этой секции образ ему будет некуда записывать. 
Несмотря на то, что во всех перечисленных случаях ассемблер, выдав предупре- 
ждение, продолжает работу, правильнее будет предположить, что вы ошиблись, 
и исправить программу. 


6 2.2.3. Команда mov 


Одна из самых часто встречающихся в программах на языке ассем- 
блера команд — это команда пересылки данных из одного места в другое. 
Она называется шоу (от слова «тоуе»). Для нас эта команда интересна 
ещё и тем, что на её примере можно обсудить целый ряд очень важных 
вопросов, таких как виды операндов, понятие длины операнда, прямую 
и косвенную адресацию, общий вид исполнительного адреса, научиться 
работать с метками и т. д. 
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Итак, команда шоу имеет два операнда, т.е. два параметра, записы- 
ваемых после мнемокода команды (в данном случае — слова «шоу») и 
задающих объекты, над которыми команда будет работать. Первый опе- 
ранд задаёт то место, куда будут помещены данные, а второй операнд — 
то, отжуда данные будут взяты. Так, например, уже знакомая нам по 
вводным примерам инструкция 


mov eax, ebx 


копирует данные из регистра EBX в регистр EAX. Важно отметить, что KO- 
манда mov только копирует данные, не выполняя никаких Npe- 
образований. Для любых преобразований следует воспользоваться дру- 
гими командами, имеющими соответствующее предназначение. 


6 2.2.4. Виды операндов 


В примерах, рассматривавшихся выше, мы встречали по меньшей ме- 
ре два варианта использования команды шоу: 


mov eax, ebx 
mov ecx, 5 


Первый вариант копирует содержимое одного регистра в другой регистр, 
тогда как второй вариант заносит в регистр некоторое число, заданное 
непосредственно в самой команде (в данном случае число 5). На этом 
примере наглядно видно, что операнды бывают разных видов. Если в po- 
ли операнда выступает название регистра, то говорят о регистровом 
операнде; если же значение указано прямо в самой команде, такой опе- 
ранд называется непосредственным операњтдом. 

На самом деле, в рассматриваемом случае следует говорить даже не о различ- 
ных типах операндов, а о двух разных командах, которые просто обозначаются 
одинаковой мнемоникой. Две команды шоу из нашего примера переводятся в со- 
вершенно разные машинные коды, причём первая из них занимает в памяти два 
байта, а вторая — пять, четыре из которых тратятся на размещение непосред- 
ственного операнда. 

Кроме непосредственных и регистровых операндов, существует ещё и 
третий вид операнда — адресный операнд, называемый также операн- 
дом типа «память». В этом случае операнд задаёт (тем или иным спосо- 
бом) адрес ячейки ‘или области памяти, с которой надлежит произве- 
сти заданное командой действие. Необходимо помнить, что в языке ас- 
семблера МАЅМ операнд типа «память» абсолютно всегда обо- 
значается квадратными скобками, в которых и пишется собственно 
адрес. В простейшем случае адрес задаётся в явном виде, то есть в фор- 
ме числа; обычно при программировании на языке ассемблера вместо 
чисел мы, как уже говорилось, используем метки. Например, мы можем 
написать: 
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section .data 
ЖЕМЕ 
count dd 0 

(символ <;> задаёт а языке ассемблера комментарий), описав область 


памяти размером в 4 байта, с адресом которой связана метка count, 
и в которой истодно хранится число О. Если теперь написать 


section .text 
; 


mov [count], eax 


эта команда mov будет обозначать копирование данных из регистра EAX 
в область памяти, помеченную меткой count, а, например, команда 


шоу edx, [count] 


будет, наоборот, обозначать копирование из памяти по адресу count в 
регистр EDX. 
Чтобы понять, зачем нужны квадратные скобки, рассмотрим команду 


шоу edx, count 


Вспомним, что метку (в данном случае count), как мы уже говорили на 
стр. 27, ассемблер просто заменяет на некоторое число, в данном случае — 
адрес области памяти. Например, если область памяти count расположе- 
на в ячейках, адреса которых начинаются с 40#2а008, то вышеприведён- 
ная команда — это абсолютно то же самое, как если бы мы написали 


шоу edx, 40f2a008h 


Теперь очевидно, что это просто уже знакомая нам форма команды mov 
с непосредственным операндом, т.е. эта команда заносит в регистр EDX 
число 40]2а008, не вникая в то, является ли это число адресом какой- 
либо ячейки памяти или нет. Если же мы добавим квадратные скобки, 
речь пойдёт уже об обращении к памяти по заданному адресу, то есть 
число будет использовано как адрес области памяти, где размещено зна- 
чение, с которым надо работать (в данном случае поместить в регистр 
EDX). 


§ 2.2.5. Прямая и косвенная адресация 


Задать адрес области памяти в виде числа или метки возможно не 
всегда. Во многих случаях нам приходится тем или иным способом вы- 
числять адрес, и уже затем обращаться к области памяти по такому вы- 
численному адресу. Например, именно так будут обстоять дела, если нам 
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потребуется заполнить все элементы какого-нибудь массива заданными 
значениями: адрес начала массива нам наверняка известен, но нужно бу- 
дет организовать цикл (по элементам массива) и на каждом шаге цикла 
выполнять копирование заданного значения в очередной (каждый раз 
другой) элемент массива. Самый простой способ исполнить это — перед 
входом в цикл задать некий адрес равным адресу начала массива и на 
каждой итерации увеличивать его. 

Важное отличие от простейшего случая, рассмотренного в предыду- 
щем параграфе, состоит в том, что адрес, используемый для доступа к 
памяти, будет вычисляться во время исполнения программы, а не за- 
даваться при её написании. Таким образом, вместо указания процессору 
«обратись к области памяти по такому-то адресу» нам нужно потребо- 
вать действия более сложного: «возьми там-то (например, в регистре) 
значение, используй это значение в качестве адреса и по этому адресу 
обратись к памяти». Такой способ обращения к памяти называют кос- 
венной адресацией (в отличие от прямой адресации, при которой 
адрес задаётся явно). 

Процессор 1386 позволяет для косвенной адресации использовать 
только значения, хранимые в регистрах процессора. Простейший вид кос- 
венной адресации — это обращение к памяти по адресу, хранящемуся в 
одном из регистров общего назначения. Например, команда, 


mov ebx, [eax] 


означает «возьми значение в регистре EAX, используй это значение B Ka- 
честве адреса, по этому адресу обратись к памяти, возьми оттуда, 4 байта 
и занеси эти 4 байта в регистр ЕВХ», тогда как команда 


шоу ебх, еах 


означала, как мы уже видели, просто «скопируй содержимое регистра 
ЕАХ в регистр ЕВХ». 

Рассмотрим небольшой пример. Пусть у нас есть массив из однобай- 
товых элементов, предназначенный для хранения строки символов, и нам 
необходимо в каждый элемент этого массива занести код символа ?@?. 
Посмотрим, с помощью какого фрагмента кода мы можем это сделать 
(воспользуемся командами, уже знакомыми нам из примера, на стр. 25)6 


6Здесь и далее комментарии к текстам примеров приводятся на русском языке. Это 
допустимо в учебном пособии, исходя из соображений наглядности. Следует, однако, 
учитывать, что в практическом программировании наличие кириллических символов 
в тексте программы представляет собой пример крайне плохого стиля. Комментарии 
в программах следует писать по-английски, что позволит любому программисту в 
мире прочитать текст вашей программы. 
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section .bss 


array resb 256 массив размером 256 байт 


>. 


section .text 

; 
шоу есх, 256 ; кол-во элементов -> в счётчик (ECX) 
mov edi, array ; адрес массива -> в EDI 


mov al, ?@? ; нужный код -> B однобайтовый AL 
again: mov [еді], al ; заносим код в очередной элемент 

inc edi ; увеличиваем адрес 

ес ecx ; уменьшаем счётчик 

jnz again ; если там не ноль, повторяем цикл 


Здесь мы использовали регистр ЕСХ для хранения числа итераций цикла, 
которые ещё осталось выполнить (изначально 256, на каждой итерации 
уменьшаем на единицу, а достигнув нуля — заканчиваем цикл), а для 
хранения адреса мы воспользовались регистром ЕРТ, в который перед 
входом в цикл занесли адрес начала массива аггау, а на каждой итера- 
ции увеличивали его на единицу, переходя, таким образом, к следующей 
ячейке. 

Внимательный читатель может заметить, что фрагмент кода написан не со- 
всем рационально. Во-первых, можно было бы использовать лишь один изменяе- 
мый регистр, либо сравнивая его не с нулём, а с числом 256, либо просматривая 
массив с конца. Во-вторых, не совсем понятно, зачем для хранения кода симво- 
ла использовался регистр АІ, ведь можно было использовать непосредственный 
операнд прямо в команде, заносящей значение в очередной элемент массива. 

Всё это действительно так, но для этого нам пришлось бы воспользовать- 
ся, во-первых, явным указанием размера операнда, а это мы ещё не обсуждали; 
и, во вторых, пришлось бы использовать команду стр, либо усложнить команду 
присваивания начального значения адреса. Таким образом, причина применения 
нами такого нерационального кода здесь — желание ограничиться наименьшим 
количеством пояснений, отвлекающих внимание от основной задачи. 


$ 2.2.6. Общий вид исполнительного адреса 


Как видно из предыдущего параграфа, адрес для обращения к памя- 
ти не всегда задан заранее; мы можем вычислить адрес уже во время 
выполнения программы, занести результат вычислений в регистр про- 
цессора и воспользоваться косвенной адресацией. 

Адрес, по которому очередная машинная команда произведёт обра- 
щение к памяти (неважно, задан ли этот адрес явно или вычислен) на- 
зывается исполнительным адресом. В предыдущем параграфе мы 
рассматривали ситуации, когда адрес вычислен, результат вычислений 
занесён в регистр и именно значение, хранящееся в регистре, использу- 
ется в качестве исполнительного адреса. Для удобства программирова- 
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Рис. 2.2. Общий вид исполнительного адреса 


ния процессор 1386 позволяет и более сложные способы задания исполни- 
тельного адреса, при которых исполнительный адрес вычисляется уже 
в тоде выполнения команды. 

Если говорить точнее, мы можем потребовать от процессора взять 
некоторое заранее заданное значение (возможно, равное нулю, а возмож- 
но, и не нулевое), прибавить к нему значение, хранящееся в одном из ре- 
гистров, а затем взять значение, хранящееся в ешё одном из регистров, 
умножить на 1, 2, 4 или 8 и прибавить результат к уже имеющемуся 
адресу. Например, мы можем написать 


шоу eax, [аггау+еъх+2*еаі] 


В результате такой команды процессор сложит число (заданное меткой 
аггау) с содержимым регистра ЕВХ и удвоенным содержимым регистра 
EDI, результат такого сложения использует в качестве исполнительно- 
го адреса, извлечёт из области памяти по этому адресу 4 байта и ско- 
пирует их в регистр ЕАХ. Каждое из трёх слагаемых, используемых в 
исполнительном адресе, является необязательным, то есть мы можем ис- 
пользовать только два слагаемых или всего одно (как, собственно, мы и 
поступали в предыдущих параграфах). 

Важно понимать, что выражение в квадратных скобках никоим об- 
разом не может быть произвольным. Например, мы не можем взять три 
регистра, не можем умножить один регистр на 2, а другой на 4, не можем 
умножать на иные числа, кроме 1, 2, 4и 8, не можем, например, перемно- 
жить два регистра между собой или вычесть значение регистра, вместо 
того чтобы прибавлять его. Общий вид исполнительного адреса показан 
на рис. 2.2; как можно заметить, в качестве регистра, подлежащего до- 
множению на коэффициент, мы не можем использовать ESP, в качестве 
же регистра, значение которого просто добавляется к заданному адресу, 
можно использовать любой из восьми регистров общего назначения. 
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С другой стороны, ассемблер допускает определённые вольности с записью 
адреса, если только он при этом может корректно преобразовать адрес в машин- 
ную команду. Во-первых, слагаемые можно расположить в произвольном порядке. 
Во-вторых, можно использовать не одну константу, а две: ассемблер сам сложит 
их и результат запишет в получающуюся машинную команду. Наконец, можно 
умножить регистр на 3, 5 или 9: если вы напишете, например, [еахж5], ассем- 
блер «переведёт» это как [еах+еах*4]. Конечно, если вы попытаетесь написать 
[еах+еЪх*5], ассемблер выдаст ошибку, ведь нужное ему слагаемое вы уже nc- 
пользовали. 

Чтобы понять, зачем может понадобиться такой сложный вид испол- 
нительного адреса, достаточно представить себе двумерный массив, со- 
стоящий, например, из 10 строк, каждая из которых содержит 15 четы- 
рёхбайтных целых чисел. Назовём этот массив matrix, поставив перед 
его описанием соответствующую метку: 


matrix аа 10*15 


Для доступа к элементам №-й строки такого массива мы можем вычис- 
лить смешение от начала массива до начала этой №-й строки (для этого 
нужно умножить М на длину строки, составляющую 15 ж 4 = 60 байт), 
занести результат вычислений, скажем, в ЕАХ, затем в другой регистр 
(например, в EBX) занести номер нужного элемента в строке — и испол- 
нительный адрес вида [мафг1х+еах+4жеЪх] в точности задаст нам место 
в памяти, где расположен нужный элемент. 


6 2.2.7. Размеры операндов и их допустимые 
комбинации 


Итак, мы ввели три типа операндов: 
1. непосредственные операнды, задающее значение прямо в команде; 


2. регистровые операнды, предписывающие взять значение из задан- 
ного регистра и/или поместить результат выполнения команды в 
этот регистр 


3. операнды типа «память», задающие адрес, по которому в памяти 
находится нужное значение и/или по которому в память нужно 
записать результат работы команды. 


Ясно, что не в любой ситуации нам подойдёт любой тип операнда. На- 
пример, очевидно, что непосредственный операнд нельзя использовать 
в качестве первого аргумента команды тоу, ведь этот аргумент должен 
задавать то место, куда производится копирование данных; мы можем 
копировать данные в регистр или в область оперативной памяти, однако 
непосредственные операнды ни того, ни другого не задают. Имеются и 
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другие ограничения, налагаемые, как правило, устройством самого про- 
пессора как электронной схемы. Так, например, ни в команде шоу, ни в 
других командах нельзя использовать сразу два операнда типа «память». 
Если необходимо, скажем, скопировать значение из области памяти х в 
область памяти у, необходимо делать это через регистр: 


шоу еах, [х] 
mov [y], eax 


Команда mov [у], [x] будет отвергнута ассемблером как ошибочная, IO- 
скольку ей не соответствует никакой машинный код: процессор попросту 
не умеет выполнять такое копирование за одну инструкцию. 

Все остальные комбинации типов операндов для команды шоу явля- 
ются допустимыми, то есть за одну команду шоу мы можем: 


1. скопировать значение из регистра в регистр 

2. скопировать значение из регистра в память 

3. скопировать значение из памяти в регистр 

4. задать (непосредственным операндом) значение регистра 


5. задать (непосредственным операндом) значение ячейки или обла- 
сти памяти. 


Последний вариант заслуживает особого рассмотрения. До сих пор во 
всех командах, которые мы использовали в примерах, хотя бы один из 
операндов был регистровым; это позволяло не думать о размере операн- 
дов, то есть о том, являются ли наши операнды отдельными байтами, 
двухбайтовыми «словами» или четырёхбайтовыми «двойными словами». 
Отметим, что команда шоу не может пересылать данные между операн- 
дами разного размера (например, между однобайтовым регистром AL и 
двухбайтовым регистром СХ); поэтому всегда, если хотя бы один из опе- 
рандов является регистровым, можно однозначно сказать, какого раз- 
мера порция данных подлежит обработке (в данном случае простому 
копированию). Однако же в варианте, когда первый операнд команды 
шоу задаёт адрес в памяти, куда нужно записать значение, а второй яв- 
ляется непосредственным (то есть записываемое значение задано прямо 
в команде), ассемблер не знает и не имеет оснований предполагать, KA- 
кого конкретно размера нужно переслать порцию данных, или, иначе 
говоря, сколько байт памяти, начиная с заданного адреса, должно быть 
записано. Поэтому, например, команда 


шоу [х], 25 ; ОШИБКА!!! 
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будет отвергнута как ошибочная: непонятно, имеется ли в виду байт со 
значением 25, «слово» со значением 25 или «двойное слово» со значени- 
ем 25. Тем не менее, команда, подобная вышеприведённой, вполне может 
понадобиться, и процессор умеет такую команду выполнять. Чтобы вос- 
пользоваться такой командой, нам нужно просто указать ассемблеру, что 
конкретно мы имеем в виду. Это делается указанием спецификатора 
размера перед любым из операндов; в качестве такого спецификатора 
может выступать слово byte, мога или днога, обозначающие, соответ- 
ственно, байт, слово или двойное слово (т. е. размер 1, 2 или 4 байта). 
Так, например, если мы хотели записать число 25 в четырёхбайтную об- 
ласть памяти, находящуюся по адресу х, мы можем написать 


mov [х], ачога 25 
или 
mov dword [x], 25 


Сделаем одно важное замечание. Различные машинные команды, вы- 
полняющие схожие действия, могут обозначаться одной и той же мнемо- 
никой. Так, 


шоу еах, 2 

шоу еах, [х] 
шоу [х], еах 
mov [х], al 


представляют собой четыре совершенно разные машинные команды, они 
имеют разные значения маптинного кода и даже занимают разное 
количество байтов в памяти. Вместе с тем, команды 


шоу еах, 2 
шоу еах, х 


используют один и тот же машинный код операции и различаются только 
значением второго операнда, который в обоих случаях непосредственный 
(лействительно, ведь метка х будет заменена на адрес, то есть просто 
число). 


6 2.2.8. Команда lea 


Возможности процессора по вычислению исполнительного адреса 
можно задействовать и отдельно от обращения к памяти. Для этого 
предусмотрена команда lea (название образовано от слов <load effective 
address>»). Команда имеет два операнда, причём первый из них обязан 
быть регистровым (размером 2 или 4 байта), а второй — операндом типа 
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«память». При этом никакого обращения к памяти команда не делает; 
вместо этого в регистр, указанный первым операндом, заносится адрес, 
вычисленный обычным способом для второго операнда. Если первый опе- 
ранд — двухбайтный регистр, то в него будут записаны младшие 16 бит 
вычисленного адреса. Например, команда 


lea eax, [1000+ерх+8жесх] 


возьмёт значение регистра ECX, умножит его на 8, прибавит к этому 3Ha- 
чение регистра ЕВХ и число 1000, а полученный результат занесёт в ре- 
гистр ЕАХ. Разумеется, вместо числа можно использовать и метку. Огра- 
ничения на выражение в скобках точно такие же, как и в других случаях 
использования операнда типа «память» (см. рис. 2.2 на стр. 49). 

Подчеркнём ещё раз, что команда 1еа только вычисляет адрес, 
не обращаясь к памяти, несмотря на использование операнда типа 
«память». 


$2.3. Целочисленная арифметика 


6 2.3.1. Простые команды сложения и вычитания 


Операции сложения и вычитания над целыми числами производятся 
соответственно командами ааа и sub. Обе команды имеют по два опе- 
ранда, причём первый из них задаёт и одно из чисел, участвующих в 
операции, и место, куда следует записать результат; второй операнд за- 
даёт второе число для операции (второе слагаемое, либо вычитаемое). 
Ясно, что первый операнд обязан быть регистровым либо типа «память»; 
второй операнд у обеих команд может быть любого типа. Как и для ко- 
манды шоу, для команд add и sub нельзя использовать два операнда типа 
«память» одновременно. 

Например, команда 


ааа eax, ebx 


означает «взять значение из регистра EAX, прибавить к нему значение из 
регистра ЕВХ, а результат записать обратно в регистр ЕАХ». Команда 


sub [x], ecx 


означает «взять четырёхбайтное число из памяти по адресу X, вычесть 
из него значение из регистра ЕСХ, результат записать обратно в память 
по тому же адресу». Команда 


ааа еах, 12 


увеличит на 12 содержимое регистра EDX, а команда 
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ааа нога [х], 12 


сделает то же самое с четырёхбайтной областью памяти по адресу х; 
обратите внимание, что нам пришлось явно указать размер операнда 
(cm. § 2.2.7, стр. 51). 

Интересно, что команды add и sub работают правильно вне зависи- 
мости от того, считаем ли мы их операнды числами знаковыми или без- 
знаковыми”. В зависимости от полученного результата команды ааа и 
Sub выставляют значения флагов OF, СЕ, ZF и SF (см. стр. 36), однако не 
всегда эти флаги имеет смысл рассматривать. 

Флаг ZF устанавливается в единицу, если в результате последней опе- 
рации получился ноль, в противном случае флаг сбрасывается; ясно, что 
значение этого флага, осмысленно как для знаковых, так и для беззнако- 
вых чисел. 

Флаг ЅЕ устанавливается в единицу, если получено отрицательное 
число, иначе он сбрасывается в ноль. Процессор производит установ- 
ку этого флага, попросту копируя в него старший бит результата; для 
знаковых чисел этот бит действительно означает знак числа, но для без- 
знаковых значение флага SF не имеет никакого смысла. 

Флаг ОЕ устанавливается, если произошло переполнение, что означает, 
что в результате сложения двух положительных получилось отрицатель- 
ное, либо, наоборот, в результате сложения двух отрицательных получи- 
лось положительное, и т.д. Ясно, что этот флаг, как и предыдущий, не 
имеет никакого смысла для беззнаковых чисел. 

Наконец, флаг СЕ устанавливается, если (для беззнаковых чисел) про- 
изошел перенос из старшего разряда, либо произошел заём из несуще- 
ствующего разряда. По смыслу этот флаг является аналогом ОЕ в при- 
менении к беззнаковым числам (результат не поместился в размер опе- 
ранда, либо получился отрицательным). Для знаковых чисел этот флаг 
смысла не имеет. 

Подчеркнём, что при сложении и вычитании процессор не зна- 
ет, работает ли он со знаковыми или с беззнаковыми числами. 
Схематически сложение и вычитание производится абсолютно одинаково 
вне зависимости от «знаковости» операндов; флаги процессор выставля- 
ет все, т.е. и те, что имеют смысл только для знаковых, и те, что имеют 
смысл только для беззнаковых. Помнить о том, какие числа имеются в 
виду — это обязанность программиста; именно программист должен ис- 
пользовать набор флагов, соответствующий знаковости обрабатываемых 
чисел. 


7Знаковость и беззнаковость целых чисел мы обсуждали в $$ 1.3.1 и 1.3.2; если вы 
не чувствуете уверенности в обращении с этими терминами, обязательно перечитайте 
эти параграфы и при необходимости задайте вопросы преподавателю, в противном 
случае вы рискуете ничего не понять в дальнейшем курсе. 
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6 2.3.2. Сложение и вычитание с переносом 


Наличие флага переноса позволяет организовать сложение и вычи- 
тание чисел, не помещающихся в регистры, способом, напоминающим 
школьное сложение и вычитание «в столбик». Для этого в процессоре 
1386 предусмотрены команды аас и зЪЪ. По своей работе и свойствам они 
полностью аналогичны командам ааа и sub, но отличаются от них тем, 
что учитывают значение флага, переноса (СЕ) на момент начала выпол- 
нения операции. Команда аас добавляет к своему итоговому результату 
значение флага переноса, команда зЪЪ, напротив, вычитает значение 
флага, переноса, из своего результата. После того как результат сформи- 
рован, обе команды заново выставляют все флаги, включая и СЕ, уже в 
соответствии с новым результатом. 

Приведём пример. Пусть у нас есть два 64-битных целых числа, при- 
чём первое записано в регистры EDX (старшие 32 бита) и EAX (младшие 
32 бита), а второе точно так же записано в регистры ЕВХ и ЕСХ. Тогда 
сложить эти два числа можно командами 


add eax, ecx ; складываем младшие части 
adc edx, ebx ; теперь старшие, с учётом переноса 


если же нам понадобится произвести вычитание, то это делается коман- 
дами 


sub eax, ecx ; вычитаем младшие части 
sbb edx, ebx ; теперь старшие, с учётом заёма 


8 2.3.3. Команды inc, дес, пер и cmp 


Чтобы завершить рассмотрение простейших арифметических опера- 
ций, опишем ещё четыре команды. 

Команды inc и dec, с которыми мы уже сталкивались в ранее при- 
ведённых примерах имеют всего один операнд (регистровый или типа 
«память») и производят, соответственно, увеличение и уменьшение на 
единицу. Обе команды устанавливают флаги 7Е, ОЕ и ЗЕ, но не затраги- 
вают флаг СЕ. Отметим, что при использовании этих команд с операндом 
типа «память» указание размера операнда оказывается обязательным: 
действительно, для ассемблера нет другого способа понять, какого раз- 
мера область памяти имеется в виду. 

Команда пер, также имеющая один операнд, обозначает смену знака, 
то есть операцию «унарный минус». Обычно её применяют к знаковым 
числам; тем не менее, она устанавливает все четыре флага ZF, OF и ЗЕ и 
СЕ, как если бы операнд вычитался из нуля. 

Наконец, команда стр (от слова «compare» — «сравнить») производит 
точно такое же вычитание, как и команда sub, за исключением того, что 
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результат никуда не записывается. Команда вызывается ради установки 
флагов, обычно сразу после неё следует команда условного перехода. 


6 2.3.4. Целочисленное умножение и деление 


В отличие от сложения и вычитания, умножение и деление схемати- 
чески реализуется сравнительно сложно®, так что команды умножения 
и деления могут показаться организованными очень неудобно для про- 
граммиста. Причина этого, по-видимому, в том, что создатели процессора 
1386 и его предшественников действовали здесь прежде всего из сообра- 
жений удобства реализации самого процессора. 

Надо сказать, что умножение и деление доставляет некоторые слож- 
ности не только разработчикам процессоров, но и программистам, и от- 
нюдь не только в силу неудобности соответствующих команд, но и по 
самой своей природе. Во-первых, в отличие от сложения и вычитания, 
умножение и деление для знаковых и беззнаковых чисел производится 
совершенно по-разному, так что небходимы и различные команды. 

Во-вторых, интересные вещи происходят с размерами операндов. При 
умножении размер (количество значащих битов) результата может быть 
вдвое больше, чем размер исходных операндов, так что, если мы не хотим 
потерять информацию, то одним флажком, как при сложении и вычита- 
нии, мы тут не обойдёмся: нужен дополнительный регистр для хранения 
старших битов результата. С делением ситуация ещё интереснее: если мо- 
дуль делителя превосходит 1, размер результата будет меньше размера 
делимого (если точнее, количество значащих битов результата двоич- 
ного деления не превосходит п — т- 1, где n и т — количество значащих 
битов делимого и делителя соответственно), так что желательно иметь 
возможность задавать делимое более длинное, чем делитель и результат. 
Кроме того, целочисленное деление даёт в качестве результата, не одно, 
а два числа: частное и остаток. Разделять между собой операции на- 
хождения частного и остатка нежелательно, поскольку может привести 
к двухкратному выполнению (на уровне электронных схем) одних и тех 
же действий. 

Все команды целочисленного умножения и деления имеют 
только один операнд?, задающий второй множитель в командах умно- 
жения и делитель в командах деления, причём этот операнд может быть 
регистровым или типа «память», но не непосредственным. Что касается 
первого множителя и делимого, то для их задания, а также в качестве 


8 На некоторых процессорах, даже современных, этих операций вообще нет, и при- 
чина этого — исключительно сложность их реализации. 

9 На самом деле, из этого правила есть исключение: команда целочисленного умно- 
жения знаковых чисел imul имеет двухместную и даже трёхместную формы, но pac- 
сматривать эти формы мы не будем: пользоваться ими ещё сложнее, чем обычной 
одноместной формой. 
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умножение деление 
разрядн. неявный результат || делимое | частное | остаток 
(бит) множитель | умножения 
8 АТ, АХ АХ АТ, АН 
16 АХ ОХ: АХ ОХ: АХ АХ рх 
32 ЕАХ Е”Х:ЕАХ EDX: EAX EAX EDX 


Таблица 2.1. Расположение неявного операнда и результатов для опера- 
ций целочисленного деления и умножения в зависимости от разрядности 
явного операнда 


цели для записи результата используются неявный операнд, в KATE- 
стве которого в данном случае выступают регистры AL, АХ, EAX, а при 
необходимости — и регистровые пары DX:AX и EDX:EAX (напомним, что 
буква А означает слово «аккумулятор»; это и есть особая роль регистра 
ЕАХ, о которой говорилось на стр. 34). 

Для умножения беззнаковых чисел применяют команду mul, для 
умножения знаковых — команду imul. В обоих случаях, в зависимости от 
разрядности операнда (второго множителя) первый множитель берётся 
из регистра АІ. (для однобайтной операции), либо АХ (для двухбайтной 
операции), либо ЕАХ (лля четырёхбайтной), а результат помещается в ре- 
гистр АХ (если операнды были однобайтными), либо в регистровую пару 
ОХ:АХ (для двухбайтной операции), либо в регистровую пару ЕБХ:ЕАХ 
(для четырёхбайтной операции). Это можно более наглядно представить 
в виде таблицы (см. табл. 2.1). 

Команды mul и imul устанавливают флаги СЕ и ОЕ в ноль, если стар- 
шая половина результата равна нулю (то есть все значащие биты ре- 
зультата уместились в младшей половине), в противном случае СЕ и ОЕ 
устанавливаются в единицу. Значения остальных флагов после выполне- 
ния mul и imul не определены (то есть ничего осмысленного сказать об 
их значениях нельзя, причём разные процессоры могут устанавливать их 
по-разному и даже в результате выполнения одной и той же команды на 
одном и том же процессоре флаги могут получить разные значения). 

Для деления (и нахождения остатка от деления) целых чисел при- 
меняют команду div (для беззнаковых) и idiv (для знаковых). Един- 
ственный операнд команды, как уже говорилось выше, задаёт делитель. 
В зависимости от разрядности этого делителя (1, 2 или 4 байта) дели- 
мое берётся из регистра АХ, регистровой пары DX:AX или регистровой 
пары EDX:EAX, частное помещается в регистр AL, АХ или EAX, а остаток 
от деления — в регистры АН, ОХ или EDX, соответственно (см. табл. 2.1). 
Частное всегда округляется в сторону нуля (для беззнаковых и положи- 
тельных — в меньшую, для отрицательных — в ббльшую сторону). Знак 
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остатка, вычисляемого командой imul, всегда совпадает со знаком де- 
лимого, а абсолютная величина (модуль) остатка всегда строго меньше 
модуля делителя. Значения флагов после выполнения целочисленного 
деления не определены. 

Отдельного рассмотрения заслуживает ситуация, когда в делителе на момент 
выполнения команды div или idiv находится число 0. Делить на ноль, как из- 
вестно, нельзя, а собственных средств, чтобы сообщить о происшедшей ошибке, 
у процессора нет. Поэтому процессор инициирует так называемое внутреннее пре- 
рывание, в результате которого управление получает операционная система; в 
большинстве случаев она сообщает об ошибке и завершает текущую задачу как 
аварийную. То же самое произойдёт и в случае, если результат деления не уме- 
стился в отведённые ему разряды: например, если мы занесём в EDX число 10h, а 
в ЕАХ — любое другое, даже просто 0, и попытаемся поделить это (то есть шест- 
надцатеричное 1000000000, или 236), скажем, на 2 (записав его, например, в ЕВХ, 
чтобы сделать деление 32-разрядным), то результат (235) в 32 разряда «не вле- 
зет», и процессору придётся инициировать прерывание. Подробнее о прерываниях 
мы расскажем в $ 4.2. 


5$ 2.4. Условные и безусловные переходы 


Как уже отмечалось, в обычное последовательное выполнение команд 
можно вмешаться, выполнив передачу управления, называемую так- 
же перетодом. Различают команды безусловных переходов, выпол- 
няющие передачу управления в другое место программы без всяких про- 
верок, и команды условных переходов, которые могут, в зависимости 
от результата, проверки некоторого условия, либо выполнить переход в 
заданную точку, либо не выполнять его — в этом случае выполнение 
программы, как обычно, продолжится со следующей команды. 


§ 2.4.1. Безусловный переход и виды переходов 


В системе команд процессора 1386 все команды передачи управления 
подразделяются, в зависимости от «дальности» такой передачи, на три 
тита. 


1. Дальние (#аг) переходы подразумевают передачу управления во 
фрагмент программы, расположенный в другом сегменте. По- 
скольку под управлением ОС Unix мы используем «плоскую» MO- 
дель памяти, в которой разделение на сегменты отсутствует (точ- 
нее, имеет место лишь один сегмент, «накрывающий» всё наше вир- 
туальное адресное пространство), такие переходы нам понадобить- 
ся не могут: у нас попросту нет других сегментов. 


2. Близкие (near) переходы — это передача управления в произ- 
вольное место внутри одного сегмента; фактически такие переходы 
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представляют собой явное изменение значения ЕТР. В «плоской» 
модели памяти это именно тот вид переходов, с помощью которо- 
го мы можем «прыгнуть» в произвольное место в нашем адресном 
пространстве. 


3. Короткие (short) переходы используются для оптимизации в 
случае, если точка, куда надлежит «прыгнуть», отстоит от теку- 
щей команды не более чем на 127 байт вперёд или 128 байт назад. 
В машинном коде такой команды смешение задаётся всего одним 
байтом, отсюда соответствующее ограничение. 


При написании команды перехода мы можем явно указать вид нуж- 
ного нам перехода, поставив после команды слово short или near (ассем- 
блер понимает, разумеется, и слово far, но нам это не нужно). Если этого 
не сделать, ассемблер выбирает тип перехода по умолчанию, причём для 
безусловных переходов это пеаг, что нас обычно устраивает, а вот для 
условных переходов по умолчанию используется short. Вытекающие из 
этого сложности и способы их преодоления мы обсудим в следующем 
параграфе, который посвящён условным переходам, а пока вернёмся к 
переходам безусловным. 

Команда безусловного перехода называется jmp (от слова «јшир», KO- 
торое буквально переводится как «прыжок»). У команды предусмотрен 
один операнд, определяющий собственно адрес, куда следует передать 
управление. Чаще всего используется форма команды jmp с непосред- 
ственным операндом, то есть адресом, указанным прямо в команде. Есте- 
ственно, указываем мы не числовой адрес (которого обычно не знаем), а 
метку. Возможно, однако, использовать и регистровый операнд (в этом 
случае переход производится по адресу, взятому из регистра), и операнд 
типа «память» (адрес читается из двойного слова, расположенного в за- 
данной позиции в памяти); такие переходы называют косвенными, в OT- 
личие от прямых, для которых адрес задаётся явно. Приведём несколь- 
ко примеров: 


jmp cycle ; переход на метку cycle 
jmp eax ; переход по адресу из регистра EAX 
jmp [addr] ; переход по адресу, содержащемуся 
; в памяти, которая помечена меткой addr 
jmp [eax] ; переход по адресу, прочитанному из 
; памяти, расположенной по адресу, 
; взятому из регистра EAX 


Здесь первая команда задаёт прямой переход, а остальные — косвенный. 

Если метка, на которую нужно перейти, находится достаточно близко к те- 
кущей позиции, можно попытаться соптимизировать машинный код, применив 
слово short: 
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шу1ађе1: 
5 
; небольшое количество команд 
5 


jmp short шу1ађе1 


На глаз обычно тяжело определить, действительно ли метка находится достаточно 
близко, тем более что макросы (например, СЕТСНАВ) могут сгенерировать целый 
ряд команд, иногда слабо предсказуемый по длине. Но на этот счёт можно не 
беспокоиться: если расстояние до метки окажется больше допустимого, ассемблер 
выдаст ошибку примерно такого вида: 


{11е.азш:35: error: short jump is out of range 


и останется только найти строку с указанным номером (в данном случае 35) и 
убрать «несработавшее» слово short. 


§ 2.4.2. Условные переходы по отдельным флагам 


В противоположность командам безусловного перехода, команды 
условного перехода ассемблер по умолчанию считает «короткими», ес- 
ли не указать тип перехода явно. 

Такой, на первый взгляд, странный подход к командам переходов обусловлен 
историческими причинами: на ранних процессорах линейки х86 условные пере- 
ходы былы только короткими, других команд просто не было. Процессор 1386 и 
все более поздние процессоры, конечно же, поддерживают и близкие условные 
переходы; дальние условные переходы до сих пор не поддерживаются, но нам они 
всё равно не нужны. 

Простейшие команды условного перехода производят переход по ука- 
занному адресу в случае, если один из флагов равен нулю (сброшен) или 
единице (установлен). Имена этих команд образуются из буквы Ј (от 
слова «литр», первой буквы названия флага (например, Z для флага ZF) 
и, возможно, вставленной между ними буквы М (от слова «поф»), если 
переход нужно произвести при условии равенства флага нулю. Все эти 
команды приведены в табл. 2.2. Напомним, что смысл каждого из флагов 
мы рассмотрели на стр. 36. 

Такие команды условного перехода обычно ставят непосредственно 
после арифметической операции (например, сразу после команды спр, 
см. стр. 55). Например, две команды 


cmp eax, ebx 
jz are_equal 


можно прочитать как приказ «сравнить значения в регистрах EAX и EBX 
и если они равны, перейти на метку аге_едпа1». 
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команда | условие || команда | условие 
перехода перехода 
jz ZF=1 jaz ZF=0 
js ЗЕ=1 jns SF=0 
јс СЕ=1 јас СЕ=0 
јо 0Е=1 jno 0Е=0 
јр РЕ=1 јар РЕ=0 


Таблица 2.2. Простейшие команды условного перехода 


§ 2.4.3. Переходы по результатам сравнений 


Если нам нужно сравнить два числа на равенство, всё довольно про- 
сто: достаточно, как в предыдущем примере, воспользоваться флагом ZF. 
Но что делать, если нас интересует, например, условие а < b? Сначала 
мы, естественно, применим команду 


cmp а, b 


(в качестве а и b могут быть любые операнды, нужно только помнить, 
что они не могут быть оба одновременно операндами типа «память»). 
Команда выполнит сравнение своих операндов — точнее говоря, вычтет 
из а значение 6 и соответствующим образом выставит значения флагов. 
Но вот дальнейшее, как мы сейчас увидим, оказывается несколько слож- 
нее. 

Если числа а и б — знаковые, то на первый взгляд всё просто: вычи- 
тание а — 6 при условии а < 6 даёт число строго отрицательное, так что 
флаг знака (SF, sign Нар) должен быть установлен, и мы можем восполь- 
зоваться командой js или jns. Но ведь результат мог и не поместиться в 
длину операнда (например, в 32 бита, если мы сравниваем 32-разрядные 
числа), то есть могло возникнуть переполнение! В этом случае значение 
флага, ЗЕ окажется прямо противоположным ожидавшемуся, зато будет 
взведён флаг OF (overflow Нар). Таким образом, условие а < b выполня- 
ется в двух случаях: если SF=1, но ОЕ=0 (то есть переполнения не было, 
число получилось отрицательное), либо если ЗЕ=0, но ОЕ=1 (число полу- 
чилось положительное, но это результат переполнения, а на самом деле 
результат отрицательный). Иначе говоря, нас интересует, чтобы флаги 
SF и OF не были равны друг другу: ЗЕ-20Е. Для такого случая в процессоре 
1386 предусмотрена команда jl (от слов «јитр if less than»), обозначае- 
мая также мнемоникой jnge («литр if not greater ог equal»). 

Рассмотрим теперь ситуацию, если числа а и b — беззнаковые. Как 
мы уже обсуждали в $2.3.1 (см. стр. 54), по итогам арифметических опе- 
раций над беззнаковыми числами флаги ОЕ и SF рассматривать не имеет 
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имя | jump if... выр. условие сино- 


ком. амф перехода ним 
равенство 
је | equal a=b ZF= 1 jz 
jne | not equal a+b ZF=0 jnz 
неравенства для знаковых чисел 
jl | less a<b SFÆ0F 
jnge | not greater ог equal 
jle | less or equal a <b | бЕ 0Е или ZF= 1 
jng | not greater 
jg | greater a>b | SF=0F и ZF=0 
jnle | not less or equal 
jge | greater or equal azb SF=0F 


jnl | not less 
неравенства для беззнаковых чисел 


jb | below a<b CF= 1 јс 
јпае | not above ог equal 
jbe | below or equal a <b | CF= 1 или ZF= 1 
jna | not above 
ja | above a>b CF= 0 и ZF= 0 
jnbe | not below or equal 
jae | above or equal а 2 СЕ= 0 јас 


jnb | not below 


Таблица, 2.3. Команды условного перехода по результатам арифметиче- 
ского сравнения (стр а, b) 


смысла, но зато осмысленным становится рассмотрение флага СЕ (carry 
Нар), который выставляется в единицу, если по итогам арифметической 
операции произошел перенос из старшего разряда (при сложении), ли- 
бо заём из несуществующего разряда (для вычитания). Именно это нам 
здесь и нужно: если а и 6 рассматриваются как беззнаковые и а < 6, то 
при вычитании а — 6 как раз и произойдёт такой заём. Таким образом, 
нам достаточно воспользоваться значением флага СЕ, то есть выполнить 
команду јс, которая специально для данной ситуации имеет синонимы 
jb (xjump if below») и јпае (<«јштр if поё above ог equal»). 

Когда нас интересуют соотношения «больше» и «меньше либо равно», 
необходимо включить в рассмотрение и флаг 7Е, который (как для зна- 
ковых, так и для беззнаковых чисел) обозначает равенство аргументов 
предшествующей команды стр. 

Все команды условных переходов по результату арифметического 
сравнения приведены в табл. 2.3. 
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$ 2.4.4. Условные переходы и регистр ЕСХ; циклы 


Как уже говорилось, некоторые регистры общего назначения в неко- 
торых случаях имеют особую роль; в частности, регистр ЕСХ лучше дру- 
гих приспособлен к роли счётчика цикла. Выражается это в том, что в 
системе команд процессора 1386 имеются специальные команды, учиты- 
вающие значение ЕСХ, а для других регистров таких команд нет. 

Одна из таких команд называется 1оор и предназначена для орга- 
низации циклов с заранее известным количеством итераций. В качестве 
счётчика цикла она использует регистр ЕСХ, в который перед началом 
цикла необходимо занести нужное число итераций. Сама команда 1оор 
выполняет два действия: уменьшает на единицу значение в регистре ЕСХ 
и, если в результате значение не стало равным нулю, производит переход 
на заданную метку. 

Отметим, что команда 1оор имеет одно важное ограничение: она вы- 
полняет только «короткие» переходы, то есть с её помощью невозможно 
осуществить переход на метку, отстоящую от самой команды более чем 
на 128 байт. 

Пусть, например, у нас есть массив из 1000 двойных слов, заданный 
с помощью директивы 


array геѕа 1000 


и мы хотим посчитать сумму его элементов. Это можно сделать с помо- 
щью следующего фрагмента кода: 


шоу есх, 1000 ; кол-во итераций 

шоу еѕі, аггау ; адрес первого элемента 

шоу еах, 0 ; начальное значение суммы 
1р: add eax, [esi] ; прибавляем число к сумме 

ааа ез1, 4 ; адрес следующего элемента 

loop 1р ; уменьшаем счётчик; 


‚ если нужно - продолжаем 


Здесь мы использовали фактически две переменные цикла — регистр 
ЕСХ в качестве счётчика и регистр ЕЗТ для хранения адреса текущего 
элемента массива. 

Конечно, можно произвести аналогичное действие и для любого дру- 
гого регистра общего назначения, воспользовавшись двумя командами. 
Например, мы можем уменьшить на единицу регистр EAX и осуществить 
переход на метку 1р при условии, что полученный в ЕАХ результат не 
равен нулю; это будет выглядеть так: 


ес eax 
jnz lp 
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Точно так же можно записать две команды и для регистра ЕСХ: 


dec ecx 
jnz lp 


Однако команда loop lp, делая те же действия, работает быстрее и 3a- 
нимает меньше памяти. 
В примере с массивом можно обойтись и без ЕЅІ, одним только счётчиком: 


шоу есх, 1000 
шоу еах, 0 

1р: add eax, [аггау+4*есх-4] 
loop 1р 


Здесь есть два интересных момента. Во-первых, массив мы вынуждены про- 
ходить с конца в начало. Во-вторых, исполнительный адрес в команде add имеет 
несколько странный вид. Действительно, регистр ЕСХ пробегает значения от 1000 
до 1 (для нулевого значения цикл уже не выполняется), тогда как адреса элемен- 
тов массива пробегают значения от аггау+4%999 до аггау+4%0, так что умножать 
на 4 следовало бы не ЕСХ, а (есх-1). Однако этого мы сделать не можем и просто 
вычитаем 4. На первый взгляд это противоречит сказанному в $ 2.2.6 относительно 
общего вида исполнительного адреса (слагаемое в виде константы должно быть 
одно, либо ни одного), однако на самом деле ассемблер МАЗМ прямо во время 
трансляции вычтет значение 4 из значения атгау и уже в таком виде оттрансли- 
рует, так что в итоговом машинном коде константное слагаемое как раз и будет 
одно. 

Рассмотрим теперь две дополнительные команды условного перехо- 
да. Команда }сх> (jump if СХ іх лего) производит условный переход, 
если в регистре СХ содержится пољ. Флаги при этом не учитываются. 
Аналогичным образом команда }есх2> производит переход, если ноль CO- 
держится в регистре ЕСХ. Как и для команды 1оор, этот переход всегда 
короткий. Чтобы понять, зачем введены эти команды, представьте себе, 
что на момент входа в цикл в регистре ЕСХ уже содержится ноль. Тогда 
сначала выполнится тело цикла, а потом команда 1оор уменьшит счёт- 
чик на единицу, в результате чего счётчик окажется равен максимально 
возможному целому беззнаковому числу (двоичная запись этого числа 
состоит из всех единиц), так что тело цикла будет выполнено 232 раз, 
тогда как по смыслу его, скорее всего, не следовало выполнять вообще. 
Чтобы избежать таких неприятностей, перед циклом можно поставить 
команду јесх2: 


; заполняем есх 
јесхх 1ра 

1р: ; тело цикла 
а 


loop 1р 
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В заключение рассмотрим две модификации команды 1оор. Команда 
1ооре, называемая также 1оорх, производит переход, если в регистре 
ECX — не ноль и при этом флаг ZF установлен, тогда как команда 1оорпе 
(или, что то же самое, 1оорпх) — если в регистре ECX не ноль и флаг ZF 
сброшен. 


$2.5. Побитовые операции 


6 2.5.1. Логические операции 


Информацию, записанную в регистры и память в виде байтов, слов и 
двойных слов можно рассматривать не только как представление целых 
чисел, но и как строки, состоящие из отдельных и (в общем случае) никак 
не связанных между собой битов. 

Для работы с такими битовыми строками используются специаль- 
ные команды побитовых операций. Простейшими из них являются 
двухместные команды апа, ог и хог, выполняющие соответствующую 
логическую операцию («и», «или», «исключающее или») отдельно над 
первыми битами обоих операндов, отдельно над вторыми битами и т.д.; 
результат, представляющий собой битовую строку той же длины, что и 
операнды, заносится, как обычно для арифметических команд, в регистр 
или область памяти, определяемую первым операндом. Ограничения на 
используемые операнды у этих команд такие же, как и у двухместных 
арифметических команд: первый операнд должен быть либо регистро- 
вым, либо типа «память», второй операнд может быть любого типа; 
нельзя использовать операнд типа «память» одновременно для первого 
и второго операнда; если ни один из операндов не является регистро- 
вым, необходимо указать разрядность операции с помощью одного из 
слов byte, мога и амога. Осуществить побитовое отрицание (инверсию) 
можно с помощью команды not, имеющей один операнд. Операнд может 
быть регистровый или типа «память»; в последнем случае, естественно, 
необходимо задать длину операнда словом byte, мога или dword. Все эти 
команды устанавливают флаги ZF, SF и РЕ в соответствии с результатом; 
обычно используется только флаг 7Е. 

В программах на языке ассемблера очень часто встречается команда XOT, оба 
операнда которой представляют собой один и тот же регистр, например, 


хог eax, eax 
Это означает обнуление указанного регистра, т.е. то же самое, что и 
шоу еах, О 


Команду хог для этого используют, потому что она занимает меньше места (2 
байта против 5 для команды шоу) и работает на несколько тактов быстрее. Некото- 
рые программисты вместо шоу еах,-1 предпочитают использовать две команды 
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SHR = 0 —> — = СЕ |= 


SHL, SAL —_| CF | — —— 0 = 


ЗАВ — — = СЕ |= 


Рис. 2.3. Схема работы команд побитового сдвига, 


хог вах,еах и пої еах, хотя выигрыш тут уже не столь заметен (4 байта кода 
против 5), а по времени исполнения тут можно и проиграть 

В случае, если необходимо просто проверить наличие в числе одно- 
го из заданных битов, может оказаться удобной команда test, которая 
работает так же, как и команда апа (то есть выполняет побитовое «и» 
над своими операндами), но результат никуда не записывает, а только 
выставляет флаги. 

В частности, для проверки на равенство нулю вместо 


cmp eax, 0 
часто используют команду 
test eax, вах 


которая занимает меньше памяти и работает быстрее. 


6 2.5.2. Операции сдвига 


Часто приходится применять операции побитового сдвига. Про- 
стейшие из них — команды простого побитового сдвига shr (shift 
right) и sh1 (shift left). Команды имеют два операнда, первый из который 
указывает, что сдвигать, а второй — на сколько битов производить сдвиг. 
Первый операнд может быть регистровым или типа «память» (во вто- 
ром случае обязательно указание разрядности). Второй операнд может 
быть либо непосредственным, то есть числом от 1 до 31 (на самом де- 
ле, можно указать любое число, но от него будут использоваться только 
младшие пять разрядов), либо регистром СЁ; никакие другие регистры 
использовать нельзя. При выполнении этих команд с регистром CL в Ka- 
честве второго операнда процессор игнорирует все разряды CL, кроме 
пяти младших. 

Схема сдвига на 1 бит следующая. При сдвиге влево старший бит 
сдвигаемого числа переносится во флаг СЕ, остальные биты сдвигаются 
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влево (то есть бит с номером! n получает значение, которое до опера- 


ции имел бит с номером п — 1), в младший бит записывается ноль. При 
сдвиге вправо, наоборот, во флаг СЕ заносится младший бит, все биты 
сдвигаются вправо (то есть бит с номером п получает значение, которое 
до операции имел бит с номером п-{ 1), в старший бит записывается ноль. 


Отметим, что для беззнаковых чисел сдвиг на п бит влево эквива- 
лентен умножению на 2”, а сдвиг вправо — целочисленному делению на 
2" с отбрасыванием остатка. Интересно, что для знаковых чисел ситу- 
ация со сдвигом влево абсолютно аналогична, а вот сдвиг вправо для 
любого отрицательного числа даст положительное, ведь в знаковый бит 
будет записан ноль. Поэтому наряду с командами простого сдвига, вво- 
дятся также и команды арифметического побитового сдвига за1 
(shift arithmetic left) и sar (shift arithmetic right). Команда sal дела- 
ет то же самое, что и команда shl (на, самом деле, это одна и та же 
машинная команда). Что касается команды sar, то она работает анало- 
гично команде shr, за исключением того, что в старшем бите значение 
сохраняется таким же, каким оно было до операции; таким образом, если 
рассматривать сдвигаемую битовую строку как запись знакового целого 
числа, то операция ваг не изменит знак числа (положительное останется 
положительным, отрицательное — отрицательным). Иначе говоря, опе- 
рация арифметического сдвига вправо эквивалентна делению на 2” с 
отбрасыванием остатка для знаковых целых чисел. Операции простых и 
арифметических сдвигов схематически показаны на рис. 2.3. 


Команды побитовых сдвигов работают гораздо быстрее, чем коман- 
ды умножения и деления; кроме того, обращаться с ними существенно 
легче: можно использовать любые регистры, так что не нужно думать 
о высвобождении аккумулятора. Поэтому при умножении и делении на 
степени двойки программисты практически всегда используют именно 
команды побитовых сдвигов. Более того, компиляторы языков высокого 
уровня при трансляции арифметических выражений тоже, как правило, 
стараются использовать сдвиги вместо умножений и делений, если это 
возможно. 


Кроме рассмотренных, процессор 1386 поддерживает также команды 
«сложных» побитовых сдвигов shrd и shld, работающих через два pern- 
стра; команды циклического побитового сдвига гог и rol; команды 
циклического сдвига через флаг СЕ — rcer и rcl. Все эти команды мы 
рассматривать не будем; при желании читатель может освоить их само- 
стоятельно. 


10 По традиции мы предполагаем, что биты занумерованы справа налево, начиная с 
нуля, то есть, например, в 32-битном числе младший бит имеет номер 0, а старший — 
номер 31. 
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6 2.5.3. Пример 


Одним из применений битовых строк в программировании является 
представление подмножеств из конечного числа исходных элементов; по- 
просту говоря, у нас имеется конечное множество объектов (например, 
сотрудники какого-нибудь предприятия, или тумблеры на каком-нибудь 
пульте управления, или даже просто числа от 0 до №) и нам в програм- 
ме нужна возможность представлять подмножество этого множества: 
какие из сотрудников в настоящее время находятся на работе; какие из 
тумблеров на пульте установлены в положение «включено»; какие из 
№ спортсменов, участвующих в марафоне, прошли очередной контроль- 
ный пункт; и т. п. Наиболее очевидное представление для подмножества 
множества N элементов — это область памяти, содержащая N двоичных 
разрядов (так, если в множество могут входить числа от 0 до 511, нам 
потребуется 512 разрядов, то есть 64 однобайтовых ячейки), где каждо- 
му из М возможных элементов приписывается один разряд, и этот разряд 
будет равен единице, если соответствующий элемент входит в подмноже- 
ство, и нулю в противном случае. Говорят, что каждому из N объектов 
присвоен один из двух статусов: либо «входит в множество» (1), либо 
«не входит в множество» (0). 


Итак, пусть нам потребовалось подмножество множества, из 512 эле- 
ментов; это могут быть совершенно произвольные объекты, нас интере- 
сует только то, что у каждого из них есть уникальный номер — число 
от 0 до 511. Чтобы хранить такое множество, мы опишем массив из 16 
«двойных слов» (напомним, что «двойное слово» содержит 32 бита и мо- 
жет, соответственно, хранить статус 32 разных объектов). Как обычно, 
элементы массива будем считать занумерованными (или имеющими UH- 
дексы) от 0 до 15. Элемент массива с индексом 0 будет хранить статус 
объектов с номерами от 0 до 31, элемент с индексом 1 — статус объектов 
с номерами от 32 до 63, и т.д. При этом внутри самого элемента биты 
будем считать занумерованными справа налево, то есть самый младший 
разряд будет иметь номер 0, самый старший — номер 31. Например, ста- 
тус объекта, с номером 17 будет храниться в 17-м бите нулевого элемента 
массива; статус объекта, с номером 37 — в 5-м бите первого элемента; ста- 
тус объекта с номером 510 — в 29-м бите 15-го элемента массива. Вообще, 
чтобы по номеру объекта Х узнать, в каком бите какого элемента мас- 
сива хранится его статус, достаточно разделить Х на 32 (количество бит 
в каждом элементе) с остатком. Частное будет соответствовать номеру 
элемента в массиве, остаток — номеру бита в этом элементе. Это можно 
было бы сделать с помощью команды div, но лучше будет вспомнить, 
что число 32 есть степерь двойки (25), так что если взять младшие пять 
бит числа Х, мы получим остаток от его деления на 32, а если выполнить 
для него побитовый сдвиг вправо на 5 позиций — результат будет равен 
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искомому частному. Например, пусть число Х занесено в регистр ЕВХ, и 
нам необходимо узнать соответствующий номер элемента и номер бита 
в элементе. Оба номера не превосходят 255 (точнее, номер элемента не 
превосходит 15, а номер бита, не превосходит 32), так что результат мы 
можем разместить в однобайтовых регистрах; пусть это будут BL (для 
номера бита) и ВН (для номера элемента массива). Поскольку занесение 
любых новых значений в ВІ. и ВН испортит содержимое регистра ЕВХ как 
целого, логично будет сначала скопировать число куда-то ещё, например 
в EDX, потом в EBX обнулить все биты, кроме пяти младших (при этом и 
значение ЕВХ как целого, и значение его младшего байта, — регистра, ВТ, 
станут равны искомому остатку от деления; потом в EDX мы выполним 
сдвиг вправо и реультат (который полностью уместится в младшем байте 
регистра EDX, то есть в регистра DL) скопируем в ВН: 


шоу edx, ebx 

and ebx, 11111Ъ ; взяли 5 младших разрядов 
shr edx, 5 ; разделили остальное Ha 32 
шоу bh, dl 


Однако то же самое можно сделать и короче, без использования допол- 
нительных регистров, ведь все нужные биты у нас с самого начала нахо- 
дятся в ЕВХ. Младшие пять разрядов числа Х — это нужный нам остаток 
от деления, а нужное нам частное — это следующие несколько (в данном 
случае — не более четырёх) разрядов. Когда в ЕВХ занесли число Х, эти 
разряды оказались в позициях, начиная с пятой, а нам нужно, чтобы 
они оказались в регистре ВН, который есть ни что иное как второй байт 
регистра ЕВХ, так что достаточно сдвинуть всё содержимое ЕВХ влево на 
три позиции, и нужный нам результат деления аккуратно «впишется» в 
ВН; после этого содержимое ВТ, мы сдвинем обратно на те же три бита, 
что заодно и очистит нам его старшие биты: 


shl ebx, 3 
shr bl, 3 


Научившись преобразовывать номер объекта B номер элемента, масси- 
ва, и номер разряда в элементе, вернёмся к исходной задаче. Для начала 
опишем массив: 


section .bss 
set512 геза 16 


Теперь у нас есть подходящая область памяти, и с адресом её начала, CBA- 
зана метка set512. Где-то в начале программы (а возможно, и не только в 
начале) нам, видимо, понадобится операция очистки множества, то есть 
такой набор команд, после которого статус всех элементов оказывается 
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нулевой (в множество не входит ни один элемент). Для этого достаточно 
занести нули во все элементы массива, например, так: 


section .text 


“ve 


xor eax, eax ; eax := 0 
mov ecx, 15 
mov esi, set512 
lp: mov [еѕі+4жесх], eax 
loop lp 


Пусть теперь y нас в регистре EBX имеется номер элемента X, и нам 
необходимо внести элемент в множество, то есть установить соответству- 
ющий бит в единицу. Для этого мы сначала найдём номер бита в элемен- 
те массива и вычислим маску — такое число, в котором только один 
бит (как раз нужный нам) равен единице, а в остальных разрядах ну- 
ли. Затем мы найдём нужный элемент массива и применим к нему и 
к маске операцию «или», результат которой занесём обратно в элемент 
массива. При этом нужный нам бит в элементе окажется равен единице, 
а, остальные не изменятся. Для вычисления маски мы возьмём единицу 
и сдвинем её на нужное количество разрядов влево. Напомним, что из 
регистров только CL может быть вторым аргументом команд побитовых 
сдвигов, так что номер бита имеет смысл сразу вычислять в СІ. Итак, 
пишем: 


; внести в множество ѕеї512 элемент, 
; номер которого находится в ЕВХ 


mov cl, bl ; получаем номер бита 
апа с1, 11111Ъ ; в регистре СІ 

mov eax, 1 ; создаём маску 

shl eax, cl ; в регистре ЕАХ 

mov edx, ebx ; вычисляем номер эл-та 
shr edx, 5 У в регистре еах 

ог [3е5512+4жеах], eax ; применяем маску 


Аналогично решается и задача по исключению элемента, из множества, 
только маска на этот раз будет инвертирована (O в нужном разряде, 
единицы во всех остальных), а применять мы её будем с командой апа 
(логическое «и»), в результате чего нужный бит обнулится, остальные 
не изменятся: 


; убрать из множества ѕеї512 элемент, 
; номер которого находится в ЕВХ 
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шоу cl, bl ; получаем номер бита 


апа cl, 11111 ; в регистре СІ 

шоу еах, 1 ; создаём маску 

shl eax, cl ; в регистре EAX 

not eax ; инвертируем маску 

шоу edx, ebx ; вычисляем номер эл-та 
shr edx, 5 ; в регистре еах 

апа [ве©512+4*еах], eax ; применяем маску 


Узнать, входит ли элемент с заданным номером в множество, можно 
тоже с помощью маски (единица в нужном разряде, нули в остальных) 
и команды test. Результат покажет флаг ZF: если он будет взведён — 
значит, соответствующего элемента в множестве не было, и наоборот: 


; узнать, входит ли в множество ѕеї512 элемент, 
; номер которого находится в EBX 


шоу cl, bl ; получаем номер бита 
апа cl, 11111Ъ ; в регистре CL 

шоу еах, 1 ; создаём маску 

shl eax, cl ; в регистре ЕАХ 

шоу edx, ebx ; вычисляем номер эл-та 
shr edx, 5 У в регистре еах 

test [5е512+4жеах], eax ; применяем маску 


; теперь ZF=1 означает, что элемент в множестве 
} отсутствовал, а 7Р=0 - что присутстовал 


Рассмотрим ещё один пример. Пусть нам потребовалось сосчитать, 
сколько элементов входят в множество. Для этого придётся просмотреть 
все элементы массива, и в каждом из них сосчитать единичные биты. Про- 
ще всего это сделать, загрузив значение из элемента массива в регистр, а 
потом сдвигая значение вправо на один бит и каждый раз проверяя, еди- 
ница ли в младшем разряде; это можно делать ровно 32 раза, но проще 
закончить, когда в регистре останется ноль. Массив мы будем просмат- 
ривать с конца, индексируя по ЕСХ: это позволит нам применить команду 
jecxz. В качестве счётчика результата воспользуемся регистром EBX, а 
для анализа, элементов массива применим ЕАХ. 


; сосчитать элементы в множестве зеї512 


хог ebx, ebx ; EBX := 0 

mov ecx, 15 ; последний индекс 
1р: тоу eax, [веї512+4*есх] ; загрузили элемент 
1р2: test eax, 1 ; единица в младшем разряде? 

jz notone ; если нет, прыгаем 

іпс ebx ; если да, увеличиваем счётчик 
пофопе: shr еах, 1 ; сдвинули EAX 
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test eax, eax ; TaM ещё что-то осталось? 
jnz 1р2 ; если да, продолжаем 
; внутренний цикл 


jecxz quit ; если B ECX ноль, заканчиваем 
dec ecx ; иначе уменьшаем его 
jmp lp ; и продолжаем внешний цикл 


quit: 
; теперь результат подсчёта находится B EBX 


$2.6. Стек, подпрограммы, рекурсия 


§ 2.6.1. Понятие стека и его предназначение 


Как известно, под стеком в про- 
граммировании подразумевают структу- 
ру данных, построенную по принципу 
«последний вошел — первый вышел» 
(англ. last in first out, LIFO), т.е. такой 
объект, над которым определены опера- 
ции «добавить элемент» и «извлечь эле- 
мент», причём элементы, которые были 
добавлены, извлекаются в обратном по- 
рядке. 

В применении к низкоуровневому 
программированию понятие стека суще- ~ T 
ственно уже: здесь под стеком понимает- Е 
ся непрерывная область памяти, для ко- 
торой в специальном регистре хранится Рис. 2.4. Стек 
адрес вершины стека, причём память 
в рассматриваемой области выше вершины (т.е. с адресами, меньши- 


свободная 
память 


указатель 
стека 
вершина 


занятая 
память 


направление увеличения адресов 
направление роста стека 


ми адреса вершины) считается свободной, а память от вершины до кон- 
ца области (до старших адресов), включая и саму вершину, считается 
занятой; регистр, хранящий адрес вершины, называется указателем 
стека (см. рис. 2.4). Операция добавления в стек некоторого значения 
уменьшает адрес вершины, сдвигая тем самым вершину вверх (то есть в 
направлении мёньших адресов) и в новую вершину записывает добавляе- 
мое значение; операция извлечения считывает значение с вершины стека 
и сдвигает вершину вниз, увеличивая её адрес. 

Стек можно использовать, например, для временного хранения значе- 
ний регистров; если некоторый регистр хранит важное для нас значение, 
а нам при этом нужно временно задействовать этот регистр для хране- 
ния другого значения, то самый простой способ выйти из положения — 
это сохранить значение регистра в стеке, затем использовать регистр под 
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другие нужды, и, наконец, восстановить исходное значение регистра, пу- 
тём извлечения этого значения из стека обратно в регистр. Но гораздо 
более важно другое: стек используется при вызовах подпрограмм 
для хранения адресов возврата, для передачи фактических па- 
раметров в подпрограммы и для хранения локальных перемен- 
ных. Именно использование стека позволяет реализовать механизм ре- 
курсии, при котором подпрограмма может прямо или косвенно вызвать 
сама, себя. 


6 2.6.2. Организация стека в процессоре 1386 


Большинство существующих процессоров поддерживают работу со 
стеком на уровне машинных команд, и 1386 в этом плане не исключе- 
ние. Команды работы со стеком позволяют заносить в стек и извлекать 
из него двухбайтные «слова» и четырёхбайтные «двойные слова»; от- 
дельные байты записывать в стек нельзя, так что адрес вершины стека, 
всегда остаётся чётным. 

Как уже говорилось (см. стр. 35), регистр ESP, формально относя- 
щийся к группе регистров общего назначения, тем не менее практически 
никогда не используется ни в какой иной роли, кроме роли указате- 
ля стека; название этого регистра как раз и означает «stack pointer». 
Считается, что адрес, содержащийся в ESP, указывает на вершину сте- 
ка, то есть на ту область памяти, где хранится последнее занесённое в 
стек значение. Стек «растёт» в сторону уменьшения адресов, то есть при 
занесении в стек нового значения ESP уменьшается, при извлечении знал 
чения — увеличивается. 

Занесение значения в стек производится командой push, имеющей 
один операнд. Этот операнд может быть непосредственным, регистро- 
вым или типа «память» и иметь размер мога или амога (если операнд не 
регистровый, то размер необходимо указать явно). Для извлечения зна- 
чения из стека используется команда рор, операнд которой может быть 
регистровым или типа «память»; естественно, операнд должен иметь раз- 
мер «слово» или «двойное слово». 

Команды push и рор совмещают копирование данных (на вершину 
стека или с неё) со сдвигом самой вершины, то есть изменением зна- 
чения регистра ЕЗР. Понятно, что можно, вообще говоря, обратиться к 
значению на вершине стека, не извлекая его из стека — применив (в 
любой команде, допускающей операнд типа «память») операнд [езр]. 
Например, команда 


шоу еах, [евр] 


скопирует четырёхбайтное значение с вершины стека в регистр ЕАХ. 
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Как говорилось выше, стек очень удобно использовать для временно- 
го хранения значений из регистров: 


push eax ; запоминаем eax 
М ... Используем еах под посторонние нужды 
рор еах ; восстанавливаем еах 


Рассмотрим более сложный пример. Пусть регистр ЕЅІ содержит ад- 
рес некоторой строки символов в памяти, причём известно, что строка 
заканчивается байтом со значением 0 (но неизвестно, какова длина стро- 
ки) и нам необходимо «обратить» эту строку, то есть записать составля- 
ющие её символы в обратном порядке в том же месте памяти; нулевой 
байт, играющий роль ограничителя, естественно, остаётся при этом на 
месте и никуда не копируется. Один из способов сделать это — последо- 
вательно записать коды символов в стек, а затем снова пройти строку 
с начала в конец, извлекая из стека символы и записывая их в ячейки, 
составляющие строку. 

Поскольку записывать в стек однобайтовые значения нельзя, мы бу- 
дем записывать значения двухбайтовые, причём старший байт просто 
не будем использовать. Конечно, можно сделать всё более рационально, 
но нам в данном случае важнее наглядность нашей иллюстрации. Для 
промежуточного хранения будем использовать регистр ВХ, причём толь- 
ко его младший байт (ВІ) будет содержать полезную информацию, но 
записывать в стек и извлекать из стека мы будем весь ВХ целиком. За- 
дача будет решена в два цикла. Перед первым циклом мы занесём ноль 
в регистр ЕСХ, потом на каждом шаге будем извлекать байт по адресу 
[еѕі+есх] и помещать этот байт (в составе слова) в стек, а ЕСХ увели- 
чивать на единицу, и так до тех пор, пока очередной извлечённый байт 
не окажется нулевым, что по условиям задачи означает конец строки. В 
итоге все ненулевые элементы строки окажутся в стеке, а в регистре ЕСХ 
будет длина строки. 

Поскольку для второго цикла заранее известно количество его ите- 
раций (длина строки) и оно уже содержится в ЕСХ, мы организуем этот 
цикл с помощью команды 1оор. Перед входом в цикл мы проверим, не 
пуста ли строка (то есть не равен ли ЕСХ нулю), и если строка была пу- 
ста, сразу же перейдём в конец нашего фрагмента. Поскольку значение в 
ЕСХ будет уменьшаться, а строку нам нужно пройти в прямом направле- 
нии — наряду с ЕСХ мы воспользуемся регистром ЕРТ, который в начале 
установим равным ЕЗТ (то есть указывающим на начало строки), а на 
каждой итерации будем его сдвигать. Итак, пишем: 


хог ерх, ebx ; обнуляем ебх 
хог есх, есх ; обнуляем есх 
1р: шоу Ъ1, [ез1+есх] ; очередной байт из строки 


cmp bl, 0 ; конец строки? 


је lpquit ; если да - конец цикла 
push bx ; bl нельзя, приходится bX 
inc ecx ; следующий индекс 
jmp 1р ; повторить цикл 

lpquit: jecxz done ; если строка пустая - конец 
mov edi, esi ; опять с начала буфера 

1р2: рор bx ; извлекаем 
шоу [edi], bl ; записываем 
inc edi ; следующий адрес 
1оор 1р2 ; повторять есх раз 


аопе: 


6 2.6.3. Дополнительные команды работы со стеком 


При необходимости можно занести в стек значение всех регистров об- 
шего назначения одной командой; эта команда называется риѕћаа (push 
all doublewords). Уточним, что эта команда заносит в стек содержимое 
регистров EAX, ECX, EDX, EBX, ESP, ЕВР, ESI и EDI (в указанном поряд- 
ке), причём значение ESP заносится в TOM виде, в котором оно было ĝo 
выполнения команды. Соответствующая команда извлечения из стека 
называется рорад (рор all doublewords). Она извлекает из стека восемь 
четырёхбайтных значений и заносит эти значения в регистры в порядке 
обратном приведённому для команды pushad, при этом значение, соот- 
ветствующее регистру ESP, игнорируется (то есть из стека извлекается, 
но в регистр не заносится). 

Регистр флагов (EFLAGS) может быть записан в стек командой 
pushfd и считан обратно командой рорѓа, однако при этом, если мы pa- 
ботаем в ограниченном режиме, только некоторые флаги (а именно — 
флаги, доступные к изменению в ограниченном режиме) могут быть из- 
менены, на остальные команда рор{4 никак не повлияет. 

Существуют аналогичные команды для 16-битных регистров, поддерживаемые 
для совместимости со старыми процессорами; они называются риѕћһам, рорам, 
pushfw и popfw, и работают полностью аналогично, но вместо 32-битных pern- 
стров используют соответствующие 16-битные. Команды риѕћам и рорам практи- 
чески никогда не используются, что касается команд рчз м и popfw, то их nc- 
пользование, в принципе, имеет смысл, если учесть, что в «расширенной» части 
регистра EFLAGS нет ни одного флага, значение которого мы могли бы поменять 
в ограниченном режиме работы. 


6 2.6.4. Подпрограммы: общие принципы 


Подпрограммой называется некоторая обособленная часть про- 
граммного кода, которая может быть вызвана из главной программы 
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(или из другой подпрограммы); под вызовом в данном случае пони- 
мается временная передача управления подпрограмме с тем, чтобы, ко- 
гда подпрограмма сделает свою работу, она вернула управление в точку, 
откуда её вызвали. Читатель, вне всякого сомнения, уже встречался с 
подпрограммами. Это, например, процедуры и функции языка Паскаль, 
функции в языке Си ит. п. 


При вызове подпрограммы необходимо запомнить адрес возврата, 
то есть адрес машинной команды, следующей за командой вызова, под- 
программы, причём сделать это так, чтобы сама вызываемая подпро- 
грамма могла, когда закончит свою работу, воспользоваться этим сохра- 
нённым адресом для возврата управления. Кроме того, подпрограммы 
часто получают параметры, влияющие на их работу, и используют в 
работе локальные переменные. Подо всё это необходимо предусмот- 
реть выделение оперативной памяти (или регистров). Самый простой 
способ решения этого вопроса — выделить каждой подпрограмме свою 
собственную область памяти под хранение всей локальной информации, 
включая и адрес возврата, и параметры, и локальные переменные. Тогда 
вызов подпрограммы потребует прежде всего записать в принадлежа- 
щую подпрограмме область памяти (в заранее оговорённые места) значе- 
ния параметров и адрес возврата, а затем передать управление в начало 
подпрограммы. 


Интересно, что когда-то давно именно так с подпрограммами и по- 
ступали. Однако с развитием методов и приёмов программирования воз- 
никла потребность в рекурсии — таком построении программы, при 
котором некоторые подпрограммы могут прямо или косвенно вызывать 
сами себя, притом потенциально неограниченное! число раз. Ясно, что 
при каждом рекурсивном вызове требуется новый экземпляр области 
памяти для хранения адреса возврата, параметров и локальных пере- 
менных, причём чем позже такой экземпляр будет создан, тем раньше 
соответствующий вызов закончит работу, то есть рекурсивные вызовы 
подпрограмм в определённом смысле подчиняются правилу «последний 
пришел — первый ушел». Совершенно логично из этого вытекает идея 
использования при вызовах подпрограмм уже знакомого нам стека. 

В современных вычислительных системах перед вызовом подпро- 
граммы в стек помещаются значения параметров вызова, затем произ- 
водится собственно вызов, то есть передача управления, которая совме- 
щена с сохранением в том же стеке адреса возврата. Наконец, когда под- 
программа получает управление, она резервирует в стеке определённое 
количество памяти для хранения локальных переменных, обычно про- 
сто сдвигая адрес вершины вниз на соответствующее количество ячеек. 
Область стековой памяти, содержащую связанные с одним вызовом 3Ha- 


1 Точнее говоря, ограниченное только объемом памяти. 
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чения параметров, адрес возврата и локальные переменные, называют 
стековым фреймом. 


6 2.6.5. Вызов подпрограмм и возврат из них 


Вызов подпрограммы, как уже стало ясно из вышесказанного, — это 
передача управления по адресу начала подпрограммы с одновременным 
запоминанием в стеке адреса возврата (то есть адреса машинной коман- 
ды, непосредственно следующей за командой вызова). Процессор 1386 
предусматривает для этой цели команду са11; аналогично команде јтр, 
аргумент команды са11 может быть непосредственным (адрес перехо- 
да задан непосредственно в команде, например, меткой), регистровым 
(адрес передачи управления находится в регистре) и типа «память» (пе- 
реход нужно осуществить по адресу, прочитанному из заданного места 
памяти). Команда са11 не имеет «короткой» формы; поскольку «даль- 
няя» форма нам, как обычно, не требуется в силу отсутствия сегментов, 
остаётся только одна форма — близкая (пеаг), которую мы всегда и ис- 
пользуем. 

Возврат из подпрограммы производится командой ret (от слова 
return). В своей простейшей форме эта команда не имеет аргументов. 
Выполняя эту команду, процессор извлекает 4 байта с вершины стека и 
записывает их в регистр ЕІР, в результате чего управление передаётся 
по адресу, который находился в памяти на вершине стека. 

Рассмотрим простой пример. Допустим, в нашей программе часто 
приходится заполнять каким-то однобайтовым значением области памя- 
ти разной длины. Такое действие вполне можно оформить в виде подпро- 
граммы. Для простоты картины примем соглашение, что адрес нужной 
области памяти передаётся через регистр EDI, количество однобайтовых 
ячеек, которые нужно заполнить — через регистр ЕСХ, ну а само значе- 
ние, которое надо записать во все эти ячейки — через регистр АІ. Код 
соответствующей подпрограммы может выглядеть, например, так: 


; fill memory (еді=адігеѕѕ, ecx=length, а1=уа1пе) 
#111_тетогу: 
jecxz fm_q 


fm_lp: mov [edi], al 
inc edi 
loop Еш_1р 


fm_q: ret 
Обратиться к такой подпрограмме можно, например, так: 


mov edi, шу_аггау 
mov ecx, 256 


тт 


mov al, ?@; 
call fill_memory 


В результате такого вызова 256 байт памяти, начиная с адреса, заданного 
меткой my_array, окажутся заполнены кодом символа ?@? (число 64). 


§ 2.6.6. Организация стековых фреймов 


Подпрограмма, приведённая в качестве примера в предыдущем пара- 
графе, фактически не использовала механизм стековых фреймов, сохра- 
няя в стеке только адрес возврата. Этого оказалось достаточно, посколь- 
ку подпрограмме не требовались локальные переменные, а параметры 
мы передали через регистры. Как показывает практика, подпрограммы 
редко бывают такими простыми. В более сложных случаях нам навер- 
няка потребуются локальные переменные, поскольку регистров на всё 
не хватит. Кроме того, передача параметров через регистры тоже мо- 
жет оказаться неудобна: во-первых, регистров может и не хватить, а во- 
вторых, подпрограмме могут быть долго нужны значения, переданные 
через регистры, и это фактически лишит её возможности использовать 
под свои внутренние нужды те из регистров, которые были задейство- 
ваны при передаче параметров. Наконец, передача параметров через ре- 
гистры (а равно и через какую-либо фиксированную область памяти) 
лишает нас возможности использовать рекурсию, что тоже, разумеется, 
плохо. 

Поэтому обычно (в особенности при трансляции программы с какого- 
либо языка высокого уровня, с того же Паскаля или Си) параметры в 
функции передаются через стек, и в стеке же размещаются локальные 
переменные. Как было сказано выше, параметры в стеке размещает вы- 
зывающая программа, затем при вызове подпрограммы в стек заносится 
адрес возврата, и, наконец, уже сама вызванная подпрограмма, резерви- 
рует место в стеке под локальные переменные. Всё это вместе и образует 
стековый фрейм. К содержимому стекового фрейма можно обращать- 
ся, используя адреса, «привязанные» к адресу, по которому содержится 
адрес возврата, то есть, иначе говоря, ту ячейку памяти, начиная с ко- 
торой в стек был занесён адрес возврата, используют в качестве своего 
рода реперной точки. Так, если в стек занести три четырёхбайтных па- 
раметра, а потом вызвать процедуру, то адрес возврата, будет лежать в 
памяти по адресу [esp], ну а параметры, очевидно, окажутся доступны 
по адресам [еѕр+4], [езр+8] и [еѕр+12]. Если же разместить в стеке 
локальные четырёхбайтные переменные, то они окажутся доступны по 
адресам [еѕр-4], [езр-8] и т.д. 

Заметим, что использовать для доступа к параметрам регистр ESP 
оказывается не слишком удобно, ведь в самой процедуре нам тоже мо- 
жет потребоваться стек (как для временного хранения данных, так и 
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[ЕВР-16] 
[ЕВР-12] езен а 


[ЕВР] 


[ЕВР+8] 
[ЕВР+12] еее 
[EBP+16] o [eeg ge 


направление увеличения адресов 
направление роста стека 


Рис. 2.5. Структура стекового фрейма 


для вызова других подпрограмм). Поэтому первым же своим действи- 
ем подпрограмма, обычно сохраняет значение регистра ЕЗР в каком-то 
другом регистре (чаще всего ЕВР) и именно его использует для доступа 
к параметрам и локальным переменным, ну а регистр ESP продолжает 
играть свою роль указателя стека, изменяясь по мере необходимости; пе- 
ред возвратом из подпрограммы его обычно восстанавливают в исходном 
значении (попросту пересылая в него значение из ЕВР), чтобы он снова 
указывал на адрес возврата. 

Наконец, возникает ещё один вопрос: а что если другие подпрограм- 
мы тоже используют регистр ЕВР для тех же целей? Ведь в этом случае 
первый же вызов другой подпрограммы испортит нам всю работу. Мож- 
но, конечно, сохранять ЕВР в стеке перед вызовом каждой подпрограммы, 
но поскольку в программе обычно гораздо больше вызовов подпрограмм, 
чем собственно самих подпрограмм, экономнее оказывается следовать 
простому правилу: каждая подпрограмма должна сама сохранить cma- 
рое значение ЕВР и восстановить его перед возвратом управления. Есте- 
ственно, для сохранения значения ЕВР тоже используется стек, причём 
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сохранение выполняется простой командой push ebp сразу после получе- 
ния управления. Таким образом, старое значение ЕВР помещается в стек 
непосредственно после адреса возврата из подпрограммы, и в качестве 
«точки привязки» используется в дальнейшем именно этот адрес вер- 
шины стека. Для этого следующей командой выполняется шоу еЪр,езр. 
В результате регистр ЕВР указывает на то место в стеке, где находит- 
ся его же, ЕВР, сохранённое значение; если теперь обратиться к памяти 
по адресу [еър+4], мы обнаружим там адрес возврата из подпрограм- 
мы, ну а параметры, занесённые в стек перед вызовом подпрограммы 
оказываются доступны по адресам [езр+8], [езр+12], [езр+16] и т.д. 
Память под локальные переменные выделяется путём простого вычитал 
ния нужной длины из текущего значения ESP; так, если под локальные 
переменные нам нужно 16 байт, то сразу после сохранения ЕВР и копиро- 
вания в него содержимого ESP нужно выполнить команду sub esp, 16; 
если (для простоты картины) все наши локальные переменные тоже за- 
нимают по 4 байта, они окажутся доступны по адресам [еър-4], [еър-8] 
и т. д. Структура стекового фрейма с тремя четырёхбайтными парамет- 
рами и четырьмя четырёхбайтными локальными переменными показана 
на рис. 2.5. 

Повторим, что в начале своей работы, согласно нашим договорённо- 
стям, каждая подпрограмма должна выполнить 


push ebp 
mov ebp, esp 
sub esp, 16 ; вместо 16 подставьте объем 


‚ памяти под локальные переменные 
а завершение подпрограммы теперь должно выглядеть так: 


шоу евр, еЬр 


рор ebp 
ret 


Интересно, что процессор 1386 поддерживает даже специальные команды для 
обслуживания стековых фреймов. Так, в начале подпрограммы вместо трёх ко- 
манд, приведённых выше, можно было бы дать одну команду 


enter 16, 0 
а вместо двух команд перед геф можно было бы написать 
leave 


Проблема, как ни странно, в TOM, что команды enter n leave работают медлен- 
нее, чем соответствующий набор простых команд, так что их практически никогда 
не используют; если дизассемблировать машинный код, сгенерированный компи- 
лятором языка Си или Паскаль, мы, скорее всего, обнаружим в начале любой 
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процедуры или функции именно такие команды, как показано выше, и ничего 
похожего на enter. Единственным оправданием существования команд enter и 
1еауе может служить их короткая запись (например, машинная команда leave 
занимает в памяти всего 1 байт), но в наше время об экономии памяти на ма- 
шинном коде обычно никто не задумывается; быстродействие практически всегда 
оказывается важнее. 

Сделаем ещё одно важное замечание. При работе под управлением ОС 
Unix мы можем не беспокоиться ни о наличии стека, ни о задании его 
размера. Операционная система создаёт стек автоматически при запуске 
любой задачи и, более того, уже во время её исполнения при необходимо- 
сти увеличивает размер доступной для стека, памяти: по мере того как 
вершина стека продвигается по виртуальному адресному пространству 
«вверх» (то есть в сторону уменьшения адресов), операционная система 
ставит в соответствие виртуальным адресам всё новые и новые страни- 
цы физической памяти. Именно поэтому на рис. 2.4 и 2.5 мы изобразили 
верхний край стека как нечто нечёткое. 


$ 2.6.7. Основные конвенции вызовов подпрограмм 


Несмотря на подробное описание механизма стековых фреймов, дан- 
ное в предыдущем параграфе, в некоторых вопросах остаётся возмож- 
ность для манёвра. Так, например, в каком порядке следует заносить в 
стек значения фактических параметров? Если мы пишем программу на 
языке ассемблера, этот вопрос, собственно говоря, не встаёт; однако он 
оказывается неожиданно принципиальным при создании компиляторов 
языков программирования высокого уровня. 


Создатели компиляторов языка, Паскаль обычно идут «очевидным» 
путём: вызов процедуры или функции транслируется с Паскаля в виде се- 
рии команд занесения в стек значений, причём значения заносятся в есте- 
ственном (для человека) порядке — слева направо; затем в код вставляет- 
ся команда са11. Когда такая процедура получает управление, значения 
фактических параметров располагаются в стеке снизу вверх, то есть по- 
следний параметр оказывается размещён ближе других к реперной точке 
фрейма (доступен по адресу [еър+8]). Из этого, в свою очередь, следует, 
что для доступа к первому (а равно и к любому другому) фак- 
тическому параметру процедуре или функции языка Паскаль 
необходимо знать общее количество этих параметров, поскольку 
расположение п-го параметра в стековом фрейме получается зависящим 
от общего количества. Так, если у процедуры три четырёхбайтных пара- 
метра, то первый из них окажется в стеке по адресу [еър+16], если же 
их пять, то первый придётся искать по адресу [еър+24]. Именно поэтому 
язык Паскаль не допускает создание процедур или функций с перемен- 
ным числом аргументов, так называемых вариадических подпрограмм 
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(что вполне нормально для учебного языка, но не совсем приемлемо для 
языка профессионального). Входящие в язык Паскаль псевдопроцедуры 
с переменным числом аргументов, такие как WriteLn, на самом деле яв- 
ляются частью самого языка, Паскаль; компилятор трансформирует их 
вызовы в нечто весьма далёкое от вызова подпрограммы на уровне ма- 
шинного кода. Так или иначе, программист не может на, Паскале описать 
свою процедуру подобного рода. 

Создатели языка Си пошли иным путём. При трансляции вызова 
функции языка Си параметры помещаются в стек в обратном поряд- 
ке и оказываются размещёнными во фрейме в порядке сверху вниз, так 
что первый параметр всегда оказывается доступен по адресу [еър+8], 
второй — по адресу [еЪр+12] и т. д., вне всякой зависимости от общего 
количества параметров (конечно, параметры по крайней мере должны 
присутствовать, то есть если функция, например, вызвана вообще без 
параметров, никакого первого параметра в стеке не будет). Это, с одной 
стороны, позволяет создание вариадических функций; в частности, в сам 
по себе язык Си не входит вообще ни одной функции, что же касается 
таких функций, как printf, scanf и др., то они реализуются в библиоте- 
ке, а не в самом языке, и, более того, сами эти функции тоже написаны 
на Си (как сказано выше, на Паскале так сделать не получается). 

С другой стороны, отсутствие в Паскале вариадических подпрограмм 
позволяет возложить заботы об очистке стека на вызываемого. Действи- 
тельно, подпрограмма языка Паскаль всегда, знает, сколько места, зани- 
мают фактические параметры в её стековом фрейме (поскольку для каж- 
дой подпрограммы это количество задано раз и навсегда и не может из- 
мениться) и, соответственно, может принять на себя заботу об очистке 
стека. Как уже говорилось, вызовов подпрограмм в любой программе 
больше, чам самих подпрограмм, так что за счёт перекладывания забо- 
ты об очистке стека с вызывающего на вызываемого достигается опреде- 
лённая экономия памяти (количества машинных команд). При исполь- 
зовании соглашений языка Си такая экономия невозможна, поскольку 
подпрограмма не знает и не может знать (в общем случае!?), сколько 
параметров ей передали, так что забота, об очистке стека от парамет- 
ров остаётся на вызывающем; обычно это делается простым увеличением 
значения ESP на число, равное совокупной длине фактических парамет- 
ров. Например, если подпрограмма ргос1 принимает на вход три четы- 
рёхбайтных параметра (назовём их a1, a2 и a3), её вызов будет выглядеть 
примерно так: 


k 


push dword a3 ; заносим в стек параметры 


12B разных ситуациях используются различные способы фиксации количества па- 
раметров; так, функция printf узнаёт, сколько параметров нужно извлечь из стека, 
путём анализа форматной строки, а функция ехес1р извлекает аргументы, пока не 
наткнётся на нулевой указатель, но и то и другое — лишь частные случаи. 
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push dword a2 

push dword а1 

call ргос1 ; вызываем подпрограмму 

ааа esp, 12 ; Убираем параметры из стека 


В случае же использования соглашений языка Паскаль последняя ко- 
манда (ааа) оказывается не нужна, обо всём позаботится вызываемый. 
Процессор 1386 даже имеет для этого специальную форму команды геї 
с одним операндом (выше в примерах мы использовали ret без операн- 
дов). Этот операнд, который может быть только непосредственным и 
всегда имеет длину два байта («слово»), задаёт количество памяти (в 
байтах), занятой параметрами функции. Например, процедуру, прини- 
мающую три четырёхбайтных параметра, комиплятор Паскаля закончит 
командой 


ret 12 


Эта команда, как и обычная команда ret, извлечёт из стека адрес воз- 
врата, и передаст по нему управление, но кроме этого (одновременно с 
этим) увеличит значение ESP на заданное число (в данном случае 12), 
избавляя, таким образом, вызвавшего от обязанности по очистке стека. 


6 2.6.8. Локальные метки 


Прежде чем мы приведём пример подпрограммы, выполняющей ре- 
курсивный вызов, необходимо рассмотреть ещё одно важное средство, 
предоставляемое ассемблером NASM — локальные метки. 

Суть и основное достоинство подпрограмм состоит в их обособленно- 
сти. Иначе говоря, в процессе написания одной подпрограммы мы обыч- 
но не помним, как изнутри устроены другие подпрограммы и воспри- 
нимаем каждую из подпрограмм, кроме одной (той, что пишется прямо 
сейчас) в виде этакой одной большой команды. Это позволяет не держать 
в голове лишних деталей и сосредоточиться на реализации конкретного 
фрагмента программы, а по окончании такой реализации выкинуть её 
детали из головы и перейти к другому фрагменту. 

Проблема, состоит в том, что в теле любой сколь бы то ни было слож- 
ной подпрограммы нам обязательно понадобятся метки, и нужно сделать 
так, чтобы при выборе имён для таких меток нам не нужно было вспо- 
минать, есть ли уже где-нибудь (в другой подпрограмме) метка с таким 
же именем. 

Ассемблер МАЗМ для этого предусматривает специальные локальные 
метки. Синтаксически эти метки отличаются от обычных тем, что начи- 
наются с точки. Ассемблер локализует такие метки во фрагменте про- 
граммы, ограниченном с обеих сторон обычными (нелокальными) мет- 
ками. Иначе говоря, локальную метку ассемблер рассматривает не саму 
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по себе, а как нечто подчинённое последней (ближайшей сверху) нело- 
кальной метке. Например, в следующем фрагменте: 


1:85 _ргос: 
; 
. сус1е: 
; 
весопа_ргос: 
; 
. сус1е: 
а 
third_proc: 
первая метка .сус1е подчинена метке first_proc, а вторая — метке 
зесоп9_ргос, так что между собой они не конфликтуют. Если метка 
. сус1е встретится в параметрах той или иной команды между метками 
first_proc и зесопа_ргос, ассемблер будет знать, что имеется в виду 
именно первая из меток .сус1е, если она встретится после зесопа_ргос, 
но перед +һіга_ргос — то задействуется вторая, тогда как появление 
метки .сус1е до first_proc или после third_proc будет рассматривать- 
ся как ошибка. Таким образом, если каждую подпрограмму начинать с 
обычной метки, а внутри подпрограммы использовать только локальные 
метки, то в разных подпрограммах мы можем использовать локальные 
метки с одинаковыми именами, и ассемблер в них не запутается. 
На самом деле, ассемблер достигает такого эффекта за счёт «не очень честно- 
го» приёма — видя метку, имя которой начинается с точки, он просто добавляет к 
ней спереди имя последней встречавшейся ему метки без точки. Таким образом, 
в примере выше речь идёт не о двух одинаковых метках .сус1е, а о двух разных 
метках first_proc.cycle и зесопа_ргос.сус1е. Полезно помнить об этом и не 
применять в программе в явном виде метки, содержащие точку, несмотря на то, 
что ассемблер это допускает. 


6 2.6.9. Пример 


Приведём пример подпрограммы, использующей рекурсию. Одна из 
простейших классических задач, решаемых рекурсивно — это сопостав- 
ление строки с образцом, её мы и используем в примере. 

Для начала уточним задачу. Даны две строки символов, длина ко- 
торых заранее неизвестна, но известно, что каждая из них ограничена, 
нулевым байтом. Первую строку мы рассматриваем как сопоставляе- 
мую, вторую воспринимаем как образец. В образце символ ??? может 
сопоставляться с произвольным символом, символ ? ж? — с произвольной 
подцепочкой символов (возможно даже пустой), остальные символы обо- 
значают сами себя и только сами с собой сопоставляются. Так, образцу 
abc?’ соответствует только строка ?аЪс?; образцу ?а?с? соответствует 
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любая строка из трёх символов, начинающаяся на ға’ и заканчивающа- 
яся на ?с? (символ в середине может быть любым). Наконец, образцу 
?а*? соответствует любая строка, начинающаяся на ?а?, ну а образцу 
?жаж› соответствует любая строка, содержащая букву ?а? в любом M€- 
сте. Необходимо определить, соответствует ли (целиком) заданная стро- 
ка заданному образцу, и вернуть результат 0, если не соответствует, и 
результат 1, если соответствует. 


Алгоритм такого сопоставления, если при этом можно использовать 
рекурсию, окажется достаточно простым. На каждом шаге мы рассмат- 
риваем оставшуюся часть строки и образца; сначала эти оставшиеся 
части совпадают со строкой и образцом, затем, по мере продвижения 
алгоритма, от них отбрасываются символы, стоящие в начале, и мы 
предполагаем, что для уже отброшенных символов сопоставление про- 
шло успешно. Первое, что нужно сделать в начале каждого шага, — это 
проверить, не кончился ли у нас образец. Если он кончился, то результат 
зависит от того, кончилась ли при этом и строка тоже. Если кончилась, 
то мы возвращаем единицу (истину), если не кончилась — возвращал 
ем ноль (ложь); действительно, с пустым образцом можно сопоставить 
только пустую строку. 


Если образец ещё не кончился, проверяем, не находится ли в начал 
ле него (то есть в первом символе остатка образца) символ ?*?. Если 
нет, то всё просто: мы производим сопоставление первых символов стро- 
ки и образца; если первый символ образца не является символом ??? и 
не равен первому символу строки, то алгоритм на этом завершается и 
мы возвращаем ложь, в противном случае считаем, что очередные сим- 
волы образца и строки успешно сопоставлены, отбрасываем их (то есть 
укорачиваем остатки обеих строк спереди) и возвращаемся к началу ал- 
горитма. 

Самое интересное происходит, если на очередном шаге первый символ 
образца оказался символом ?*?. В этом случае нам нужно последова- 
тельно перебрать возможности сопоставления этой «звёздочки» с пустой 
подцепочкой строки, с одним символом строки, с двумя символами и т. д., 
пока не кончится сама строка. Делаем мы это следующим образом. Заво- 
дим целочисленную переменную Т, которая будет у нас обозначать теку- 
щий рассматриваемый вариант. Присваиваем этой переменной ноль (на- 
чинаем рассмотрение с пустой цепочки). Теперь для каждой рассматри- 
ваемой альтернативы отбрасываем от образца один символ (звёздочку), 
а, от строки — столько символов, какое сейчас число в переменной Т. По- 
лученные остатки пытаемся сопоставить, используя для этого вызов 
той самой подпрограммы, которую мы сейчас пишем, то есть произво- 
дим рекурсивный вызов «самих себя». Если результат вызова — истина, 
то мы на этом завершаемся, тоже вернув истину. Если же результат — 
ложь, то мы проверяем, можно ли ещё увеличивать переменную Т (не 
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вылетим ли мы при этом за пределы сопоставляемой строки). Если уве- 
личиваться уже некуда, завершаем работу, вернув ложь. В противном 
случае возвращаемся к началу цикла и рассматриваем следующее воз- 
можное значение Т. 

Для читателей, знакомых с языком программирования Си, отметим, что на 
этом языке вышеописанный алгоритм может быть реализован следующей функ- 
цией: 


int match(const char *str, const char жраф) 
{ 
int i; 
for(;; str++, раф++) { 
switch(*pat) { 
case 0: 
return *str == 0; 
case ?*?; 
for(i=0; ; i++) { 
if (шаїсһ (ѕїг+і, pat+1)) return 1; 
if(!str[i]) return 0; 
} 
case ???: 
if(!*str) return 0; 
break; 
default: 
if(*str != *pat) return 0; 


} 


На Паскале такая же функция будет выглядеть несколько более громоздко. Причи- 
ной тому, во-первых, отсутствие в Паскале арифметики указателей, и во-вторых, 
приницпиально другой подход к работе со строками, который в данной конкрет- 
ной задаче менее удобен (хотя во многих других задачах оказывается удобнее, 
чем подход, традиционный для Си). Вот пример реализации: 


function паёсһ (ѕїг, раї: string): boolean; 
function до _таїсһ (ѕїг_іпа, раї _іпа: integer): boolean; 
var і: integer; 
begin 
while true do begin 
if pat_ind > length(pat) then begin 
do_match := str_ind > length(str); exit 
end; 
if pat[pat_ind] = ?*? then begin 
for i:=0 to length(str)-str_ind+1 do 
if do_match(str_ind+i, pat_ind+1) then begin 
do_match := true; exit 
end; 
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ао _таїсһ := false; exit 
епа else 
if (str_ind > length(str)) ог 
((str[str_ind] <> pat[pat_ind]) and 
(pat [pat_ind] <> ›??)) 


then begin 
do_match := false; exit 
end; 
str_ind := str_ind + 1; 
pat_ind := pat_ind + 1; 
end 
end; 
begin 
match := do_match(1,1) 


end; 


Передав в функцию match строки, подлежащие сопоставлению, мы дальше MEHA- 
ем только индексы; чтобы организовать по ним рекурсию, мы описали локальную 
функцию do_match, которая и выполняет всю работу. 

Реализацию на языке ассемблера мы выполним в виде подпрограм- 
мы, которую назовём match. Подпрограмма будет предполагать, что 
ей передано два параметра — адрес строки ([еър+8]) и адрес образ- 
ца ([еър+12]); сама подпрограмма будет использовать одну четырёх- 
байтную переменную для хранения Т; под неё будет выделяться место 
в стековом фрейме и она будет, соответственно, располагаться по адресу 
[еър-4]. Для увеличения скорости работы наша подпрограмма в самом 
начале скопирует адреса из параметров в регистры ЕЗТ (адрес строки) и 
ЕРІ (адрес образца). Кроме того, для выполнения арифметических дей- 
ствий наша, подпрограмма будет использовать регистр ЕАХ. Через него 
же подпрограмма, будет возвращать результат своей работы: число 0 как 
обозначение логической лжи (соответствие не найдено) или число 1 как 
обозначение логической истины (соответствие найдено). 

«Отбрасывание» символов из начала строк мы будем производить 
простым увеличением рассматриваемого адреса строки: действительно, 
если по адресу string находится строка, мы можем считать, что по ад- 
ресу в©г1їп +1 находится та же строка, кроме первой буквы. 

Необходимо обратить внимание, что подпрограмма будет рекурсивно 
вызывать сама себя, и, будучи вызванной рекурсивно, должна будет вы- 
полнять работу над значениями, отличающимися от тех, что были зада- 
ны в предыдущем вызове. Между тем, регистры в качестве хранилища 
локальных данных понадобятся как исходному вызову подпрограммы, 
так и «вложенному» (рекурсивному), но в процессоре только один набор 
регистров. Мы выйдем из положения вполне традиционным способом: 
наша функция будет перед началом работы сохранять в стеке не только 
ЕВР, но и все остальные регистры, которые она использует, а перед воз- 
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вратом управления регистры будут восстанавливаться; в данном случае 
мы используем ESI, EDI и EAX, но EAX в любом случае «испортится», IO- 
скольку через него мы возвращаем итоговое значение, так что сохранять 
нужно только ESI и EDI. Так обычно действуют не только в случае pe- 
курсии, но и вообще в любых подпрограммах: этот подход позволяет в 
любой из наших подпрограмм не думать о том, что подпрограммы, к ко- 
торым мы обращаемся, могут испортить регистры, где хранятся нужные 


нам значения. 


match: 
push ebp 
mov ebp, esp 
sub esp, 4 


push esi 

push edi 

mov esi, [ebp+8] 

mov edi, [ebp+12] 
.again: 


cmp byte [edi], 0 
jne .not_end 
cmp byte [esi], 0 
jne near .false 
jmp .true 

.not_end: 
cmp byte [edi], ›*? 
jne .not_star 


mov dword [ebp-4], 0 
.star_loop: 


mov eax, edi 
inc eax 

push eax 

mov eax, esi 
add eax, [ebp-4] 
push eax 

call match 


add esp, 8 
test eax, eax 
jnz .true 


НАЧАЛО ПОДПРОГРАММЫ 
организуем стековый фрейм 


локальная переменная Т 
будет по адресу [еЪр-4] 
сохраняем регистры ESI и EDI 
(ЕАХ всё равно изменится) 
загружаем параметры: адреса 
строки и образца 
сюда мы вернёмся, когда 
сопоставим очередной 
символ и сдвинемся 
образец кончился? 
если нет, прыгаем 
образец кончился, а строка? 
если нет, то вернуть ЛОЖЬ 
кончились одновременно: ИСТИНА 
если образец не кончился... 
не звёздочка ли в его начале? 
если нет, прыгаем отсюда 
звёздочка! организуем цикл 
І :=0 


готовимся к рекурс. вызову 
сначала второй аргумент: 
образец со след. символа 


теперь первый аргумент: 
строка с Т-го символа 
(напомним, [еБр-4] - это І) 
вызываем сами себя, но 
с новыми параметрами 
после вызова очищаем стек 
что нам вернули? 
Вернули не ноль, т.е. ИСТИНУ 
Значит, остаток строки 
сопоставился с остатком 
образца => вернём истину 
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add eax, [ерр-4] Н 


cmp byte [еѕі+еах], 0; 
је .Ға1ѕе 5 
inc мога [еЪр-4] ; 
jmp .star_loop ; 
.not_star: ; 
mov al, [edi] ; 
cmp al, ??? ; 
je .quest ; 
cmp al, [esi] ; 
jne .false 5 
jmp .вооп В 
.ачевї: ; 
cmp byte [esi], O Н 
jz .false р 
.goon: inc esi ; 
inc edi ; 
jmp .араіп В 
гое: В 
шоу еах, 1 В 
jmp .quit 
.false: В 
хог eax, eax Е 
. 9016: В 
рор edi В 
рор ез1 ; 
mov esp, ebp В 
рор ebp ; 
геї 5 


Если, например, ваша строка 


вернули 0, т.е. ЛОЖЬ 
надо попробовать больше 
символов "списать" на 
эту звёздочку 
Но, быть может, строка 

уже кончилась? 
Тогда пробовать больше нечего 
Иначе пробуем: І := І +1 


и в начало цикла по І 


сюда мы попадаем, если обр. 
не пуст и не нач. с **? 
может быть, там знак ??? 
если да, прыгаем отсюда 
если нет, 
строки и образца должны 
если строка 
кончилась, эта проверка 
тоже не пройдёт 
Не совпали (или кон. строки) 
=> возвращаем ЛОЖЬ 
Совпали - продолжаем 
просмотр 
Образец начинается с '7? 
Надо только, чтобы строка не 
кончилась (иначе ЛОЖЬ) 
Символы сопоставились => 


символы в начале 


совпадать; 


сдвигаемся по строке и 
образцу и продолжаем 

Сюда мы прыгали, чтобы 
вернуть ИСТИНУ 


А сюда прыгали, чтобы 
вернуть ЛОЖЬ 

конец работы 
Приводим всё в 
порядок перед 
возвратом управления 
Результат у нас в ЕАХ 
Возвращаем управление 
КОНЕЦ ПРОЦЕДУРЫ 


Всё, 


располагается в памяти, помеченной 


меткой string, а образец — в памяти, помеченной меткой pattern, то 
вызов подпрограммы match будет выглядеть вот так: 


push анога pattern 
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push амога string 
call match 
add esp, 8 


После этого результат сопоставления (0 или 1) окажется в регистре ЕАХ. 

Обратите внимание, что в начале подпрограммы при попытке перейти на мет- 
ку .Ға1ѕе мы были вынуждены явно указать, что переход является «ближним» 
(near). Дело в том, что метка .false оказалась чуть дальше от команды перехода, 
чем это допустимо для «короткого» перехода. См. обсуждение на стр. 60. 


$2.7. Строковые операции 


Для упрощения выполнения действий над массивами (непрерывными 
областями памяти) процессор 1386 вводит несколько команд, объединяе- 
мых в категорию строковыт операций. Именно эти команды исполь- 
зуют регистры ЕЗТ и ЕРТ в их особой роли, обсуждавшейся на стр. 35. 
Общая идея строковых команд состоит в том, что чтение из памяти вы- 
полняется по адресу из регистра ЕЅІ, запись в память — по адресу из 
регистра EDI, а затем эти регистры увеличиваются (или уменьшаются) в 
зависимости от команды на 1, 2 или 4. Некоторые команды производят 
чтение в регистр или запись в память из регистра; в этом случае ис- 
пользуется регистр «аккумулятор» соответствующего размера, то есть 
регистр AL, АХ или EAX. Строковые команды не имеют операндов, всегда 
используя одни и те же регистры. 

«Направление» изменения адресов (движения вдоль строк) определя- 
ется флагом DF (напомним, его имя означает «direction Нар», т.е. «флаг 
направления»). Если этот флаг сброшен, адреса увеличиваются (то есть 
строковая операция выполняется слева направо), если флаг установлен — 
адреса уменьшаются (соответственно, работаем справа налево). Устано- 
вить DF можно командой std (set direction), а сбросить — командой cld 
(clear direction). 

Самые простые из строковых команд — команды stosb, stosw и 
stosd, которые записывают в память по адресу [еді], соответственно, 
байт, слово или двойное слово из регистра AL, АХ или EAX, после чего уве- 
личивают или уменьшают (в зависимости от значения DF) регистр EDI 
на 1, 2 или 4. Например, если у нас есть массив 


buf resb 1024 


и нам нужно заполнить его нулями, мы можем применить следующий 
код: 


хог al, al ; обнуляем al 
mov edi, buf ; адрес начала массива 
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шоу есх, 1024 ; длина массива 


с1а ; работаем в прямом направлении 
1р: stosb ; al -> [edi], увел. edi 
loop 1p 


Эти и другие строковые команды удобно использовать с префиксом rep. 
Команда, снабженная таким префиксом, будет выполнена столько раз, 
какое число было в регистре ECX (кроме команды StOSW: если её снабдить 
префиксом, то будет использоваться регистр СХ; это обусловлено истори- 
ческими причинами). С помощью префикса гер мы можем переписать 
вышеприведённый пример без использования метки: 


хог al, al 
mov edi, buf 
mov ecx, 1024 
cld 

rep stosb 


Команды lodsb, lodsw и lodsd, наоборот, считывают байт, слово или 
двойное слово из памяти по адресу, находящемуся в регистре ЕЗТ, и по- 
мещают прочитанное в регистр AL, АХ или EAX, после чего увеличивают 
или уменьшают значение регистра ESI на 1, 2 или 4. Использование этих 
команд с префиксом гер обычно бессмысленно, поскольку мы не сможем 
между последовательными исполнениями строковой команды вставить 
какие-то ещё действия, обрабатывающие значение, прочитанное и поме- 
щённое в регистр. Однако использование команд серии lods без префик- 
са может оказаться весьма полезным. Пусть, например, у нас есть массив 
четырёхбайтных чисел 


аггау геѕа 256 


и нам необходимо сосчитать сумму его элементов. Это можно сделать 
следующим образом: 


хог ebx, ebx ; зануляем сумму 
mov esi, array 
mov ecx, 256 
cld 
lp: lodsd 
add ebx, eax 
loop 1p 


Часто оказывается удобным сочетание команд серии lods с соответству- 
ющими командами stos. Пусть, например, нам нужно увеличить на еди- 
ницу все элементы того же самого массива. Это можно сделать так: 
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mov esi, array 
mov edi, esi 
mov ecx, 256 
cld 

lp: lodsd 
inc eax 
stosd 
loop 1p 


Если же необходимо просто скопировать данные из одной области 
памяти в другую, очень удобны оказываются команды movsb, тоуѕы и 
поуза. Эти команды копируют байт, слово или двойное слово из памяти 
по адресу [esi] в память по адресу [еді], после чего увеличивают (или 
уменьшают) сразу оба регистра ЕЗТ и ЕрІ (соответственно, на 1, 2 или 
4). Например, если у нас есть два строковых массива, 


buf1 resb 1024 
buf2 resb 1024 


и нужно скопировать содержимое одного из них в другой, можно сделать 
это так: 


шоу есх, 1024 
шоу esi, buf1 
mov edi, buf2 
cld 

rep movsb 


Благодаря возможности изменять направление работы (с помощью DF), 
мы можем производить копирование частично перекрывающихся об- 
ластей памяти. Пусть, например, в массиве bufi содержится строка 
"This is а string" и нам нужно перед словом "string" вставить слово 
"Топ". Для этого сначала нужно скопировать область памяти, начиная 
с адреса [buf1+10], на пять байт вперёд, чтобы освободить место для 
слова "long" и пробела. Ясно, что производить такое копирование мы 
можем только из конца в начало, иначе часть букв будет затёрта до то- 
го, как мы их скопируем. Таким образом, если слово "long " (вместе с 
пробелом) содержится в буфере buf2, то вставить его во фразу, находя- 
щуюся в buf1, мы можем так: 


std 

mov edi, buf1+17+5 
mov esi, buf1+17 
mov ecx, 8 

rep movsb 
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mov esi, buf2+4 
mov ecx, 5 
rep movsb 


Кроме перечисленных, процессор 1386 реализует команды cmpsb, 
cmpsw и стрѕа (compare string), а также зсазЪ, зсази и зсаза (scan 
string). Команды серии зсаз сравнивают аккумулятор (соответственно, 
AL, АХ или EAX) с байтом, словом или двойным словом по адресу [edi], 
устанавливая соответствующие флаги подобно команде спр, и увеличи- 
вают /уменьшают EDI Команды серии стрѕ сравнивают байты, слова или 
двойные слова, находящиеся в памяти по адресам [lesi] и [edi], уста- 
навливают флаги и увеличивают /уменьшают оба регистра. 

Кроме префикса гер, можно воспользоваться также префиксами repz 
и герпх (также называемыми repe и repne), которые, кроме уменьше- 
ния и проверки регистра ЕСХ (или СХ, если команда двухбайтная) также 
проверяют значение флага ZF и продолжают работу, только если этот 
флаг установлен (гер2/гере) или сброшен (герп /герпе). Обычно эти 
префиксы используют как раз в сочетании с командами серий зсаз и 
cmps. 


5 2.8. Ещё несколько интересных команд 


В завершение изучения системы команд процессора 1386 рассмотрим 
ешё несколько команд. 

Команды сЪм, cwd, сиде и cdq предназначены для увеличения разряд- 
ности знакового числа; попросту говоря, они заполняют дополнитель- 
ные разряды значением знакового бита исходного числа. Все эти четыре 
команды не имеют операндов и всегда работают с одними и теми же ре- 
гистрами. Команда съм расширяет число в регистре AL до всего регистра 
АХ, т.е. заполняет разряды регистра АН. Команда cwd расширяет число в 
регистре АХ до регистровой пары ВХ: АХ, то есть заполняет разряды pern- 
стра рх. Команда сие расширяет тот же регистр АХ до регистра EAX, 
заполняя старшие 16 разрядов этого регистра. Наконец, команда саа 
расширяет EAX до регистровой пары ЕБХ:ЕАХ, заполняя разряды pern- 
стра EDX. Особенно актуальными эти команды оказываются в сочетании 
с командой целочисленного деления (div, см. § 2.3.4). 

Команды movsx (move signed extension) и movzx (move zero extension) 
позволяют совместить копирование с увеличением разрядности. Обе KO- 
манды имеют по два операнда, причём первый операнд обязан быть реги- 
стровым, а второй может быть регистром или памятью, и в любом случае 
длина первого операнда должна быть вдвое больше длины второго (то 
есть можно копировать из байта в слово или из слова в двойное сло- 
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во). Недостающие разряды команда MOVZX заполняет нулями, а команда 
поузх — значением старшего бита исходного операнда. 

Наконец, рассмотрение системы команд не может считаться закончен- 
ным без команды пор. Она выполняет очень важное действие: не делает 
ничего. Само её название образовано от слов «Мо ОРегайоп». 


$ 2.9. Заключительные замечания 


Конечно, мы не рассмотрели и десятой доли возможностей процессо- 
ра 1386, если же говорить о расширениях его возможностей, появившихся 
в более поздних процессорах (например, ММХ-регистры), то доля изучен- 
ного нами окажется ещё скромнее. Однако писать программы на языке 
ассемблера мы теперь можем, и это позволит нам получить опыт про- 
граммирования в терминах машинных команд, что, как было сказано 
в предисловии, является необходимым условием качественного програм- 
мирования вообще на любом языке программирования: нельзя создавать 
хорошие программы, не понимая, что на самом деле происходит. 

Читатели, у которых возникнет желание изучить аппаратную плат- 
форму 1386 более глубоко, могут обратиться к технической документации 
и справочникам, которые в более чем достаточном количестве представ- 
лены в сети Интернет. Хочется, однако, заранее предупредить всех, у кого 
возникнет такое желание, что процессор 1386 (отчасти «благодаря» тяже- 
лому наследию 8086) имеет одну из самых хаотичных и нелогичных си- 
стем команд в мире; особенно это становится заметно, как только мы по- 
кидаем уютный мир ограниченного режима и «плоской» модели памяти, 
в котором нас заботливо устроила операционная система, и встречаемся 
лицом к лицу с программированием дескрипторов сегментов, нелепыми 
прыжками между кольцами защиты и прочими «прелестями» платфор- 
мы, с которыми приходится бороться создателям современных операци- 
онных систем. 

Так что, если вас всерьёз заинтересовало низкоуровневое программи- 
рование, мы можем посоветовать поизучать другие архитектуры, напри- 
мер, процессоры SPARC. Впрочем, любопытство в любом случае не порок, 
и если вы готовы к определённым трудностям — то найдите любой спра- 
вочник по 1386 и изучайте на здоровье :-) 
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Глава 3. Ассемблер NASM 


Ранее мы использовали ассемблер МАЅМ, ограничиваясь лишь об- 
щими замечаниями и изредка отвлекаясь, чтобы описать некоторые его 
возможности, без которых не могли обойтись. Так, в $ 1.5 было дано ров- 
но столько пояснений, чтобы можно было понять одну простейшую про- 
грамму. В 82.2 нам потребовалось использовать память для хранения 
данных, и пришлось посвятить $ 2.2.2 директивам резервирования памя- 
ти и меткам. Прежде чем привести в $ 2.6.9 пример сложной подпрограм- 
мы, мы вынуждены были в § 2.6.8 рассказать про локальные метки. 


Эту главу мы целиком посвятим изучению ассемблера МАЅМ, начав 
с более формального, чем раньше, описания синтаксиса его языка. После 
этого мы изучим возможности его макропроцессора и закончим это всё 
кратким описанием ключей командной строки, используемых при запус- 


ке МАЗМ. 


$3.1. Синтаксис языка ассемблера NASM 


Основной синтаксической единицей практически любого языка ассем- 
блера (и МАЅМ тут не исключение) является строка текста. Этим язы- 
ки ассемблера отличаются от большинства (хотя и далеко не всех) языков 
высокого уровня, в которых символ перевода строки приравнивается к 
обычному пробелу. 


Если по каким-либо причинам нам не хватило длины строки, чтобы 
уместить всё, что мы хотели в ней уместить, то можно воспользоваться 
средством «склеивания» строк. Если последним символом строки поста- 
вить «обратный слэш» (символ «\»), то ассемблер будет считать сле- 
дующую строку продолжением предыдущей. Отметим, что это гораздо 
лучше, чем допускать в тексте программы очень длинные строки; обыч- 
но строка программы (любой, не только на языке ассемблера) не должна 
превышать 75 символов, хотя компиляторы этого от нас и не требуют. 
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Строка текста! на языке ассемблера NASM состоит (в общем случае) 


из четырёх полей: метки, имени команды, операндов и комментария, при- 
чём метка, имя команды и комментарий являются полями необязатель- 
ными, что касается операндов, то требования к ним налагаются коман- 
дой; если имя команды отсутствует, то отсутствуют и операнды. Могут 
отсутствовать и все четыре поля, тогда строка оказывается пустой. Ас- 
семблер пустые строки игнорирует, но мы можем использовать их, чтобы 
визуально разделять между собой части программы. 

В качестве метки можно использовать слово, состоящее из латинских 
букв, цифр, а также символов ?_?, ?$?, °#›, 2@?, 27, ›.?и ???, причём 
начинаться метка может только с буквы или символов ?_?, ??? и ?.?; 
как мы видели в § 2.6.8, метки, начинающиеся с точки, считаются локаль- 
ными. Кроме того, в некоторых случаях имя метки можно предварить 
символом ?$?; обычно это используется, если нужно создать метку, имя 
которой совпадает с именем регистра, команды или директивы”. Надо oT- 
метить, что ассемблер различает регистр букв в именах меток, то есть, 
например, ?1аЪе1?, ›ГАВЕТ,?, ?1Іаре1? и 'ГаВеГ? — это четыре разные 
метки. После метки, если она в строке присутствует, можно поставить 
символ двоеточия, но не обязательно. Как уже отмечалось, обычно про- 
граммисты ставят двоеточия после меток, на которые можно передавать 
управление, и не ставят двоеточия после меток, обозначающих области 
памяти. Хотя ассемблер и не требует поступать именно так, программа 
при использовании этого соглашения становится яснее. 

В поле имени команды, если оно присутствует, может быть обозна- 
чение машинной команды (возможно, с префиксом гер, см. стр. 91; cy- 
ществуют и другие префиксы), либо псевдокоманды — директивы спе- 
циального вида (некоторые из них мы уже рассматривали, и к этому 
вопросу ещё вернёмся), либо, наконец, имя макроса (с такими мы тоже 
встречались, к ним относится, например, использовавшийся в примерах 
РВІМТ; созданию макросов будет посвяшён отдельный параграф). В от- 
личие от меток, в именах машинных команд и псевдокоманд ассемблер 
регистры букв не различает, так что мы можем с равным успехом напи- 
сать, например, mov, MOV, Mov и даже ш0у, хотя так писать, конечно же, 
не стоит. В именах макросов, как и в именах меток, регистр различается. 

Требования к содержимому поля операндов зависят от того, какая 
конкретно команда, псевдокоманда или макрос указаны в поле коман- 
ды. Если операндов больше одного, то они разделяются запятой. В поле 


Здесь и далее под «строкой» понимается в том числе и «логическая» строка, 
склеенная из нескольких строк с помощью обратных слэшей; в дальнейшем мы не 
будем уточнять, что имеем в виду именно такие строки. 

2 Такое может понадобиться только в случае, если ваша программа состоит из MO- 
дулей, написанных на разных языках программирования; тогда в других модулях 
вполне могут встретиться метки, совпадающие по имени с ключевыми словами ас- 
семблера, и может потребоваться возможность на них ссылаться. 
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операндов часто приходится использовать названия регистров, и в этих 
названиях регистр букв не различается, как и в именах машинных ко- 
манд. 

Читателю, запутавшемуся в том, где же регистр важен, а где нет, 
можно порекомендовать одно простое правило: ассемблер nasm не pas- 
личает заглавные и строчные буквы во всех словах, которые он 
ввёл сам: в именах команд, названиях регистров, директивах, 
псевдокомандах, обозначениях длины операндов и типа перехо- 
дов (слова byte, dword, near и т.п.), но при этом считает заглав- 
ные и строчные разными буквами в тех именах, которые вводит 
пользователь (программист, пишущий на языке ассемблера) — 
в метках и именах макросов. 

Отметим ещё одно свойство МАЗМ, связанное с записью операндов. 
Операнд типа «память» всегда записывается с использованием 
квадратных скобок. Для некоторых других ассемблеров это не так, 
что порождает постоянную путаницу. 

Комментарий обозначается символом «точка с запятой» (<;>). Haun- 
ная с этого символа, весь текст до конца строки ассемблер не принимает 
во внимание, что позволяет написать там всё, что угодно. Обычно это ис- 
пользуют для вставки в текст программы пояснений, предназначенных 
для тех, кому придётся этот текст прочитать. 


$3.2. Псевдокоманды 


Под псевдокомандами понимается ряд вводимых ассемблером 
МАЅМ слов, которые могут использоваться синтаксически так же, как 
и мнемоники машинных команд, хотя машинными командами на самом 
деле не являются. Некоторые такие псевдокоманды, а именно db, ам, аа, 
resb, гезм и геѕа нам уже известны из $ 2.2.2. Отметим только, что кроме 
перечисленных, NASM поддерживает также псевдокоманды resq, rest, 
dq и dt. Буква а в их названиях означает «quadro» — «учетверённое CO- 
во» (8 байт), буква t — от слова «феп» и означает десятибайтные элемен- 
ты. Эти псевдокоманды могут потребоваться только в программе, рабо- 
тающей с числами с плавающей точкой (попросту говоря, дробными чис- 
лами); более того, dq и dt в качестве инициализаторов допускают толь- 
ко, и исключительно, числа с плавающей точкой (например, 71.361775). 
Кроме псевдокоманд dq и dt, числа с плавающей точкой принимает и 
псевдокоманда dd; это обусловлено тем, что стандарт ІЕЕЕ-754° преду- 


ЗТЕЕЕ-754 — это международный стандарт, описывающий способ представления в 
машинной памяти чисел с плавающей точкой и регламентирующий операции над ни- 
ми; стандарт был создан под эгидой американской организации Institute of Electrical 
and Electronics Engineers (IEEE), представляющей собой профессиональную ассоциа- 
цию инженеров в области электротехники и электроники. 
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сматривает три формата чисел с плавающей точкой — обычные, двойной 
точности и повышенной точности, занимающие, соответственно, 4 байта, 
8 байт и 10 байт. 

Отдельного разговора, заслуживает псевдокоманда еда, предназна- 
ченная для определения констант. Эта псевдокоманда всегда применя- 
ется в сочетании с меткой, то есть не поставить перед ней метку считается 
ошибкой. Псевдокоманда еди связывает стоящую перед ней метку с явно 
заданным. числом. Самый простой пример: 


four equ 4 


Здесь мы определили метку four, задающую число 4. Теперь, напри- 
мер, 


mov eax, four 
есть то же самое, что и 
шоу еах, 4 


Уместно напомнить, что, вообще говоря, любая метка представляет со- 
бой не более чем число, но метки, введённые другим способом (помеча- 
ющие другие строки) связываются с адресами в памяти (которые, 
разумеется, есть тоже ни что иное как просто числа). 

Одно из самых частых применений директивы еди — это связать с 
некоторым именем (меткой) длину массива, только что заданного с помо- 
щью директивы db, dw или любой другой. Для этого используется псев- 
дометка $, которая в каждой строчке, где она появляется, обозначает 
текущий адрес“. Например, можно написать так: 


msg db "Hello and welcome", 10, O 
msglen equ $-msg 


Выражение $-msg, представляющее собой разность двух чисел, извест- 
ных ассемблеру во время его работы, будет просто вычислено прямо во 
время ассемблирования. Поскольку $ означает адрес, ставший текущим 
уже после описания строки, а msg — адрес начала строки, то их разность 
в точности равна длине строки (в нашем примере 19). К вычислению 
выражений во время ассемблирования мы вернёмся в $ 3.4. 

Директива times позволяет повторить какую-нибудь команду (или 
псевдокоманду) заданное количество раз. Например, 


stars times 4096 db ?ж› 


4'Точнее говоря, текущее смещение относительно начала секции. 


98 


задаёт область памяти размером в 4096 байт, заполненную кодом симво- 
ла ?*?, точно так же, как это сделали бы 4096 одинаковых строк, содер- 
жащих директиву аЬ ?*›. 

Иногда может оказаться полезной псевдокоманда іпсђіп, позволяющая Co- 
здать область памяти, заполненную данными из некоторого внешнего файла. По- 
дробно мы её рассматривать не будем; заинтересованный читатель может изучить 
эту директиву самостоятельно, обратившись к документации. 


$ 3.3. Константы 


Константы в языке ассемблера МАЅМ делятся на четыре катего- 
рии: целые числа, символьные константы, строковые константы и числа 
с плавающей точкой. 


Как уже говорилось (см. стр.41), целочисленные константы 
можно задавать в десятичной, двоичной, шестнадцатеричной и восьме- 
ричной системах счисления. Если просто написать число, состоящее из 
цифр (и, возможно, знака «минус» в качестве первого символа), то это 
число будет воспринято ассемблером как десятичное. Шестнадцатерич- 
ное число можно задать тремя способами: прибавив в конце числа букву 
h (например, 2af3h), либо написав перед числом символ $, как в Borland 
Pascal (например, $2а+ 3), либо поставив, опять таки, перед числом CHM- 
волы 0X, как в языке Си (0х2а#3). При использовании символа $ необ- 
ходимо следить, чтобы сразу после $ стояла цифра, а не буква, так что 
если число начинается с буквы, необходимо добавить 0 (например, $0#9 
вместо просто $+9). Это необходимо, чтобы ассемблер не путал запись 
числа с записью пользовательской метки, перед которыми, как мы уже 
говорили, иногда тоже ставится знак $. Восьмеричное число обознача- 
ется добавлением после числа буквы о или а (например, 6340, 7544). 
Наконец, двоичное число обозначается буквой Ъ (10011011Ъ). 

Символьные константы и строковые константы очень IO- 
хожи друг на друга, и, более того, в любом месте, где по смыслу должна 
быть строковая константа, можно употребить и символьную. Разница 
между строковыми и символьными константами заключается только в 
их длине: под символьной константой подразумевается такая константа, 
которая укладывается в длину «двойного слова» (то есть содержит не 
более 4 символов) и может, в силу этого, рассматриваться как альтер- 
нативная запись целого числа (либо битовой строки). И символьные, и 
строковые константы могут записываться как с помощью двойных кавы- 
чек, так и с помощью апострофов. Это позволяет использовать в строках 
и сами символы апострофов и кавычек: если строка содержит символ ка- 
вычек одного типа, то её заключают в кавычки другого типа (см. пример 
на стр. 43). 
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Символьные константы, содержащие меньше 4 символов, считаются синони- 
мами целых чисел, младшие байты которых равны кодам символов из константы, 
а недостающие старшие байты заполнены нулями. При использовании символь- 
ных констант следует помнить, что целые числа в компьютерах с процессорами 
1386 записываются в обратном порядке байтов, то есть младший байт идёт пер- 
вым. В то же время, по смыслу строки (и символьной константы) код первой бук- 
вы должен в памяти размещаться первым. Поэтому, например, константа ?аЪса? 
эквивалентна числу 64636261: 64h — это код буквы d, 61h — код буквы а, и в 
обоих случаях байт со значением 61h стоит первым, а 64h — последним. В Heko- 
торых случаях ассемблер воспринимает в качестве строковых и такие константы, 
которые достаточно коротки и могли бы считаться символьными. Это происходит, 
например, если ассемблер видит символьную константу длиной более 1 символа 
в параметрах директивы db или константу длиной более двух символов в napa- 
метрах директивы ач. 

Константы с плавающей точкой, задающие дробные числа, 
синтаксически отличаются от целочисленных констант наличием деся- 
тичной точки. Учтите, что целочисленная константа 1 и константа 
1.0 не имеют между собой ничего общего! Для наглядности от- 
метим, что битовая запись числа с плавающей точкой 1.0 одинарной 
точности (то есть запись, занимающая 4 байта, так же, как и для це- 
лого числа) эквивалентна записи целого числа 3#800000Һ (1065353216 в 
десятичной записи). Константу с плавающей точкой можно задать и в 
«экспоненциальном» виде, используя букву е или Е. Например, 1.0е-5 
есть то же самое, что и 0.00001. Обратите внимание, что десятичная 
точка по-прежнему обязательна. 


$3.4. Вычисление выражений во время 
ассемблирования 


Ассемблер МАЅМ в некоторых случаях вычисляет встретившиеся ему 
арифметические выражения непосредственно во время ассемблирования. 
Важно понимать, что в итоговый машинный код попадают только 
вычисленные результаты, а не сами действия по их вычисле- 
нию. Естественно, для вычисления выражения во время ассемблирова- 
ния необходимо, чтобы такое выражение не содержало никаких неизвест- 
ных: всё, что нужно для вычисления, должно быть известно ассемблеру 
во время его работы. 


6 3.4.1. Вычисляемые выражения и операции в них 


Выражение, вычисляемое ассемблером, должно быть целочислен- 
ным, то есть состоять из целочисленных констант и меток, и использо- 
вать операции из следующего списка: 
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ө + и - — сложение и вычитание 


© * — умножение; 


/ и h — целочисленное деление и остаток от деления (для беззна- 
ковых целых чисел); 


e // и %% — целочисленное деление и остаток от деления (для знако- 
вых целых чисел); 


e &, |, 7 — операции побитового «и», «или», «исключаюшего или»; 
® << и >> — операции побитового сдвига влево и вправо; 


® унарные операции - и + используются в их обычной роли: - меняет 
знак числа на противоположный, + не делает ничего; 


e унарная операция ~ обозначает побитовое отрицание. 


При применении операций % и 7% необходимо обязательно оставлять 
пробельный символ после знака операции, чтобы ассемблер не перепутал 
их с макродирективами (макродирективы мы рассмотрим позже). 

Ещё одна унарная операция, seg, для нас неприменима ввиду отсутствия сег- 
ментов в «плоской» модели памяти. 

Унарные операции имеют самый высокий приоритет, следом за ними 
идут операции умножения, деления и остатка от деления, ещё ниже при- 
оритет у операций сложения и вычитания. Далее (в порядке убывания 
приоритета) идут операции сдвигов, операция &, затем операция ^, и 3a- 
мыкает список операция |, имеющая самый низкий приоритет. Порядок 
выполнения операций можно изменить, применив круглые скобки. 


6 3.4.2. Критические выражения 


Ассемблер анализирует исходный текст в два прохода. На первом про- 
ходе вычисляется размер всех машинных команд и других данных, под- 
лежащих размещению в памяти программы; в результате этого ассемблер 
устанавливает, какое числовое значение должно быть приписано каждой 
из встретившихся в тексте программы меток. На втором проходе генери- 
руется собственно машинный код и прочее содержимое памяти. Второй 
проход нужен, чтобы, например, можно было ссылаться на метку, стоя- 
щую в тексте позже, чем ссылка на неё: когда ассемблер видит метку, 
скажем, в команде jmp, раньше, чем встретится собственно команда, IO- 
меченная этой меткой, на первом проходе он не может сгенерировать 
код, поскольку не знает численного значения метки. На втором проходе 
все значения уже известны, и никаких проблем с генерированием кода 
не возникает. 
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Всё это имеет прямое отношение к механизму вычисления выраже- 
ний. Ясно, что выражение, содержащее метку, ассемблер может вычис- 
лить на первом проходе только в случае, если метка стояла в тексте 
раньше, чем вычисляемое выражение; в противном случае вычисление 
выражения приходится отложить до второго прохода. Ничего страшного 
в этом нет, если только значение выражения не влияет на размер 
команды, выделяемой области памяти и т. п., то есть от значения 
этого выражения не зависят численные значения, которые нужно будет 
приписать дальнейшим встреченным меткам. Если же это условие не 
выполнено, то невозможность вычислить выражение на первом проходе 
приведёт к невозможности выполнить задачу первого прохода — опреде- 
лить численные значения всех меток. Более того, в некоторых случаях 
не помогло бы никакое количество проходов, даже если бы ассемблер это 
умел. В документации к ассемблеру МАЅМ приведён такой пример: 


times (1аЪе1-$) db 0 
label: db Меге am I?’ 


Здесь строчка с директивой times должна, ввести столько нулевых бай- 
тов, насколько метка label отстоит от самой этой строчки — но ведь 
метка label как раз и отстоит от этой строчки настолько, сколько нуле- 
вых байтов будет введено. Так сколько же их должно быть введено?! 

В связи с этим мы вводим понятие критического выражения: 
это такое выражение, вычисляемое во время ассемблирования, которое 
ассемблеру необходимо вычислить во время первого прохода. Критиче- 
скими ассемблер считает любые выражения, от которых тем или иным 
образом зависит размер чего бы то ни было, располагаемого в памя- 
ти (и которые, следовательно, могут повлиять на значения меток, вво- 
димых позже). В критических выражениях можно использовать только 
числовые константы, а также метки, определённые выше по тексту про- 
граммы, чем рассматриваемое выражение. Это гарантирует возможность 
вычисления выражения на первом проходе. 

Кроме аргумента директивы times, к категории критических OTHO- 
сятся, например, выражения в аргументах псевдокоманд гезЪ, геѕы и 
др., а также в некоторых случаях — выражения в составе исполнитель- 
ных адресов, которые могут повлиять на итоговый размер ассемблиру- 
емой команды. Так, команды «тоу еах, [еъх]», «mov еах, [еЪъх+10]» и 
«шоу eax, [е0х+10000]1» порождают соответственно 2 байта, 3 байта, и 6 
байтов кода, поскольку число, входящее в состав исполнительного адре- 
са, в первом случае занимает всего 1 байт, во втором — 2, а в последнем — 
4; но сколько памяти займёт команда 


mov eax, [еЪх+1аЪе1] 
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если значение label пока не определено? Впрочем, этих трудностей MOX- 
но избежать, если внутри исполнительного адреса в явном виде указать 
разрядность словом byte, мога или dword. Так, если написать 


mov eax, [ebx + Якога label] 


то, даже если значение label emë не известно, длина его (и, как след- 
ствие, длина всей машинной команды) уже указана. 


6 3.4.3. Выражения в составе исполнительного адреса 


На рис. 2.2 (см.стр.49) мы приводили общий вид исполнительного 
адреса (операндов типа «память») с точки зрения машинных команд. 
Ассемблер МАЅМ может воспринимать и более сложные выражения в 
квадратных скобках, лишь бы их было возможно привести к указанному 
виду. Так, например, в команде 


шоу eax, [5жеьх] 


используется умножение на число 5, что вроде бы запрещено (умножать 
можно только на 1, 2, 4 и 8), но ассемблер справляется с этой сложностью, 
приведя в команде операнд к виду [еЪх+4*еЪх], который уже вполне 
корректен. Если же рассмотреть команду 


mov eax, [еЪх+4жесх+Бжх+у] 


в которой X и у — некоторые метки, TO и с этим ассемблер справится, 
попросту вычислив выражение 5*х+у и получив в итоге одно число, что 
уже вполне соответствует общему виду исполнительного адреса. 

Необходимо только помнить, что, если только в явном виде не указать 
нужную разрядность, такие выражения будут считаться критическими, 
то есть должны зависеть только от меток, уже введённых к моменту 
рассмотрения выражения (см. предыдущий параграф). 


$3.5. Макросредства и макропроцессор 


§ 3.5.1. Основные понятия 


Под макропроцессором понимают программное средство, которое 
получает на вход некоторый текст и, пользуясь указаниями, данными в 
самом тексте, частично преобразует его, давая на выходе, в свою оче- 
редь, текст, но уже не имеющий указаний к преобразованию. В приме- 
нении к языкам программирования макропроцессор — это преобразова- 
тель исходного текста программы, обычно совмещённый с компилятором; 
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текст программы ке; =з ы 
POP текст программы результат 
с макродирективами макропроцессор транслятор 
\. у. без макросов 


и макровызовами трансляции 


Рис. 3.1. Схема работы макропроцессора 


результатом работы макропроцессора является текст на языке про- 
граммирования, который потом уже обрабатывается компилятором в 
соответствии с правилами языка (см. рис. 3.1). 

Поскольку языки ассемблера обычно весьма бедны по своим изоб- 
разительным возможностям (если сравнивать их с языками высокого 
уровня), то, чтобы хоть как-то компенсировать программистам неудоб- 
ства, обычно ассемблеры снабжают очень мощными макропроцессорами. 
В частности, рассматриваемый нами ассемблер МАЗМ содержит в себе 
алгоритмически полный макропроцессор, который мы можем при жела- 
нии заставить написать за, нас едва, ли не всю программу. 

С макросами мы уже встречались: часто использовавшиеся нами 
PRINT и FINISH представляют собой именно макросы, или, точнее, имена, 
макросов. 

Вообще, макросом называют некоторое правило, в соответствии с 
которым фрагмент программы, содержащий определённое слово, должен 
быть преобразован. Само это слово называют именем макроса; часто 
вместо термина «имя макроса» используют просто слово «макрос», хотя 
это и не совсем верно. 

Прежде чем мы сможем воспользоваться макросом, его необходи- 
мо определить, то есть, во-первых, указать макропроцессору, что некий 
идентификатор отныне считается именем макроса (так что его появле- 
ние в тексте программы требует вмешательства макропроцессора), и, во- 
вторых, задать то правило, по которому макропроцессор должен дей- 
ствовать, встретив это имя. Фрагмент программы, определяющий мак- 
рос, называют макроопределением. Когда макропроцессор встречает 
в тексте программы имя макроса и параметры (так называемый вызов 
макроса, или макровызов), он заменяет имя макроса (и, возможно, 
параметры, относящиеся к нему) неким фрагментом текста, полученным 
в соответствии с определением макроса. Такая замена называется MAK- 
роподстановкой, а текст, полученный в результате — мокрорасшире- 
ниемб. 

Бывает и так, что макропроцессор производит преобразование тек- 
ста программы, не видя ни одного имени макроса, но повинуясь ещё 
более прямым указаниям, выраженным в виде макродиректив. Одну 
такую макродирективу мы уже знаем: это директива ўіпс1оае, которая 


5 Термин «макрорасширение» — это не слишком удачная калька с соответствую- 
щего английского термина «тасго expansion». 
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приказывает макропроцессору заменить её саму на содержимое файла, 
указанного параметром директивы. Так, привычная нам строка 


Уаюс1аае "stud_io.inc" 


заменяется на всё, что есть в файле з$4а_1о. inc. 


6 3.5.2. Простейшие примеры макросов 


Чтобы составить представление о том, как можно воспользоваться 
макропроцессором и для чего он нужен, приведём два простых примера. 
Как мы видели из 882.6.6, 2.6.7 и 2.6.9, запись вызова подпрограммы на 
языке ассемблера занимает несколько строк (если быть точными, 2 + п, 
где п — число параметров подпрограммы). Это не всегда удобно, особенно 
для людей, привыкших к языкам высокого уровня. Пользуясь механиз- 
мом макросов, мы можем изрядно сократить запись вызова подпрограм- 
мы. Для этого мы опишем макросы рса111, рса112 и т. д., для вызова, 
соответственно, процедуры от одного параметра, двух параметров и т.д. 
С помощью таких макросов запись вызова, процедуры сократится до од- 
ной строчки; например, вместо 


push edx 

push dword mylabel 
push dword 517 
call myproc 

add esp, 12 


можно будет написать 
рса113 шургос, Амога 517, амога ту1ађе1, edx 


что, конечно, гораздо удобнее и понятнее. Позже, разобравшись с мак- 
роопределениями глубже, мы перепишем эти макросы, вместо них введя 
один макрос рса11, работающий для любого количества аргументов, но 
пока для примера ограничимся частными случаями. Итак, пишем мак- 
роопределение: 


Ушасго рса111 2 ; 2 -- кол-во параметров макроса 
push %2 
call %1 
add esp, 4 

%епашасго 


Мы описали многострочный макрос с именем рса111, имеющий два 
параметра: имя вызываемой процедуры для команды call и аргумент 


105 


процедуры для занесения в стек. Строки, написанные между директива- 
ми /тасго и ^епатасго, составляют тело макроса — шаблон для TEK- 
ста, который должен получиться в результате макроподстановки. Сама 
макроподстановка в данном случае будет довольно простой: макропро- 
цессор только заменит вхождения %1 и %2 соответственно на первый и 
второй параметры, заданные в макровызове. Если после такого опреде- 
ления в тексте нашей программы встретится строка вида 


рса111 ргос, еах 


макропроцессор воспримет эту строку как макровызов и выполнит мак- 
роподстановку в соответствии с вышеприведённым макроопределением, 
считая первым параметром слово ргос, вторым параметром слово еах и 
подставляя их вместо 1 и 42. В результате получится следующий фраг- 
мент: 


push eax 
call proc 
add esp, 4 


Аналогичным образом опишем макросы рса112 и рса113 


Ушасго рса112 3 
push 73 
push 72 
call %1 
add esp, 8 

%епашасго 

%macro рса113 4 
push %4 
push %3 
push %2 
call %1 
add esp, 12 

%епашасго 


Для полноты можно дописать также и макрос рса110: 


%macro рса110 1 
call %1 
Хепатасго 


Конечно, такой макрос, в отличие от предыдущих, ничуть не сокраща- 
ет объём программы, но зато он позволит нам все вызовы подпрограмм 
оформить единообразно. Описание макросов рса114, рса115 и т.д. до 
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рса118 оставляем читателю в качестве упражнения; заодно для самопро- 
верки ответьте на вопрос, почему мы предлагаем остановиться именно на 
рса118, а не, например, на рса119 или рса1112. 


Рассмотренный нами пример использовал многострочный макрос; 
как мы убедились, вызов многострочного макроса синтаксически выгля- 
дит точно так же, как использование машинных команд или псевдоко- 
манд: вместо имени команды пишется имя макроса, затем через запятую 
перечисляются параметры. При этом многострочный макрос всегда пре- 
образуется в одну или несколько строк на языке ассемблера. Но что 
если, к примеру, нам нужно сгенерировать с помощью макроса некото- 
рую часть строки, а не фрагмент из нескольких строк? Такая потреб- 
ность тоже возникает довольно регулярно. Так, в примере, приведённом 
в $ 2.6.9, видно, что внутри процедур очень часто приходится использо- 
вать конструкции вроде [ebp+12], [еър-4] и т. п. для обращения к na- 
раметрам процедуры и её локальным переменным. В принципе, к этим 
конструкциям несложно привыкнуть; но можно пойти и другим путём, 
применив однострочные макросы. Для начала напишем следующие 
макроопределения: 


/аеғіпе агр1 еЪр+8 
/аеғіпе агр2 еһр+12 
/аеғіпе arg3 ebp+16 
%define locali ebp-4 
%define 1оса12 ebp-8 
%define 1оса13 ebp-12 


В дополнение к ним допишем ещё и такое: 


/аеғіпе агв(п) ebp+(4*n)+4 
/аеғіпе 1оса1 (п) еЪр-(4жп) 


Теперь к параметру процедуры можно обратиться так: 
mov eax, [argi] 

или так (если, например, не хватило описанных макросов) 
шоу [arg(7)], edx 


В принципе мы могли и квадратные скобки включить внутрь макросов, чтобы не 
писать их каждый раз. Например, если изменить определение макроса агр1 на 
следующее: 


6 Здесь и далее в наших примерах мы предполагаем, что все параметры процедур 
и все локальные переменные всегда представляют собой «двойные слова», то есть 
имеют размер 4 байта; на самом деле, конечно, это не всегда так, но нам сейчас 
важнее иллюстративная ценность примера. 
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^аеҒіпе агрі [еЪр+8] 
то соответствующий макровызов стал бы выглядеть так: 
шоу еах, агр1 


Мы не сделали этого из соображений сохранения наглядности. Ассемблер МАЗМ 
поддерживает, как мы уже знаем, соглашение о том, что любое обращение к па- 
мяти оформляется с помощью квадратных скобок, если же их нет, то мы имеем 
дело с непосредственным или регистровым операндом. Программист, привыкший 
к этому соглашению, при чтении программы будет вынужден прилагать лишние 
усилия, чтобы вспомнить, что агр1 в данном случае не метка, а имя макроса, так 
что здесь происходит именно обращение к памяти, а не загрузка в регистр адреса 
метки. Понятности программы такие вещи отнюдь не способствуют. Учтите, что и 
вы сами, будучи даже автором программы, можете за несколько дней начисто за- 
быть, чтб же имелось в виду, и тогда экономия двух символов (скобок) обернётся 
для вас потерей бесценного времени. 


§ 3.5.3. Однострочные макросы; макропеременные 


Как видно из примеров предыдущего параграфа, однострочный мак- 
рос — это такой макрос, определение которого состоит из одной строки, 
а его вызов разворачивается во фрагмент строки текста (то есть может 
использоваться для генерации части строки). Отметим, что единожды 
определённый макрос можно при необходимости переопределить, просто 
вставив в текст программы ещё одно определение того же самого мак- 
роса. С того момента, как макропроцессор «увидит» новое определение, 
он будет использовать его вместо старого. Таким образом, одно и то же 
имя макроса в разных местах программы может означать разные вещи 
и раскрываться в разные фрагменты текста. Более того, макрос вооб- 
ще можно убрать, воспользовавшись директивой undef; встретив такую 
директиву, макропроцессор немедленно «забудет» о существовании мак- 
роса. Представляет интерес вопрос о том, что будет, если в определении 
одного макроса использовать вызов другого макроса, а этот последний, 
в свою очередь, время от времени переопределять. 

Если для описания однострочного макроса А использовать уже знако- 
мую нам директиву #ае?1пе и в её теле использовать макровызов макро- 
са В, то этот макровызов в самой директиве не раскрывается; макропро- 
цессор оставляет вхождение макроса В как оно есть до тех пор, пока не 
встретит вызов макроса А. Когда же будет выполнена макроподстановка 
для А, в её результате будет содержаться В, и для него макропроцес- 
сор, в свою очередь, выполнит макроподстановку. Таким образом, будет 
использовано то определение макроса В, которое было актуальным в мо- 
мент подстановки А. 

Поясним сказанное на примере. Пусть мы ввели два макроса: 
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4аеғіпе thenumber 25 
/деғіпе mkvar dd thenumber 


Если теперь написать в программе строчку 
уаг1 mkvar 


то макропроцессор сначала выполнит макроподстановку для mkvar, по- 
лучив строку 


уаг1 аа thenumber 
а из неё, в свою очередь, макроподстановкой thenumber получит строку 
vari dd 25 


Если теперь переопределить thenumber и снова воспользоваться вызовом 
шкуат: 


4аеғіпе thenumber 36 
var2 mkvar 


то результатом работы макропроцессора будет строка, содержащая имен- 
но число 36: 


уаг2 аа 36 


несмотря на то, что сам макрос шкуаг мы не изменяли: на первом шаге бу- 
дет получено, как и в прошлый раз, аа thenumber, но у thenumber теперь 
значение 36, оно и будет подставлено. Такая стратегия макроподстановок 
называется «ленивой"». Однако ассембер NASM позволяет применять 
и другую стратегию, называемую энергичной, для чего предусмотрена 
директива %хае?1пе. Эта директива полностью аналогична директиве 
Жае?1пе с той только разницей, что, если в теле описания макроса встре- 
чаются макровызовы, макропроцессор производит их макроподстановки 
незамедлительно, не дожидаясь, пока пользователь вызовет описывае- 
мый макрос. Так, если в вышеприведённом примере заменить директиву 
Жае?1пе в описании макроса ткуаг на %хае?1пе: 


{define thenumber 25 

%хае®*1пе mkvar dd thenumber 
vari mkvar 

{define thenumber 36 

var2 mkvar 


7Такое название является калькой английского lazy и частично оправдано тем, что 
макропроцессор как бы «ленится» выполнять макроподстановку (в данном случае 
макроса thenumber), пока его к этому не вынудят. 
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то обе получившиеся строки будут содержать число 25: 


уаг1 аа 25 
уаг2 аа 25 


Переопределение макроса thenumber теперь не в силах повлиять на рабо- 
ту макроса ткуаг, поскольку тело макроса mkvar на этот раз не содержит 
слова thenumber: обрабатывая определение шкуаг, макропроцессор под- 
ставил вместо слова thenumber его значение (25). 


Иногда возникает потребность связать с именем макроса не просто 
строку, а число, являющееся результатом вычисления арифметического 
выражения. Ассемблер МАЗМ позволяет это сделать, используя дирек- 
тиву йавв1рп. В отличие от define и %хае?1пе‚ эта директива не только 
выполняет все необходимые подстановки в теле макроопределения, но и 
пытается вычислить тело как обыкновенное целочисленное арифмети- 
ческое выражение. Если это не получается, фиксируется ошибка. Так, 
если написать в программе сначала, 


%assign var 25 
а потом 
%assign var var+1 


TO в результате с макроименем var будет связано значение 26, которое и 
будет подставлено, если макропроцессор встретит слово уаг в дальней- 
шем тексте программы. 

Макроимена, вводимые директивой assign, обычно называют MAK- 
ропеременными. Как мы увидим далее, макропеременные являются 
важным средством, позволяющим задать макропроцессору целую про- 
грамму, результатом которой может стать очень длинный текст на языке 
ассемблера. 


$3.5.4. Условная компиляция 


Часто при разработке программ возникает потребность в создании 
различных версий исполняемого файла с использованием одного и того 
же исходного текста. Допустим, мы пишем программы на заказ и у нас 
есть два заказчика Петров и Сидоров, причём программы для них почти 
одинаковы, но у каждого из двоих имеются специфические потребности, 
отсутствующие у другого. В такой ситуации хотелось бы, конечно, иметь 
и поддерживать один исходный текст: в противном случе у нас появятся 
две копии одного и того же кода, и придётся, например, каждую найден- 
ную ошибку исправлять в двух местах. Однако при компиляции версии 
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для Петрова нужно исключить из работы фрагменты, предназначенные 
для Сидорова, и наоборот. 

Подобная потребность возникает и в других ситуациях. Известно, на- 
пример, что отладочная печать (то есть вставка, в программу специаль- 
ных операций вывода, позволяющих понять, что происходит во время 
работы программы) является одним из самых универсальных и мощных 
средств отладки программ; в то же время окончательная версия про- 
граммы, разумеется, не должна содержать операций отладочной печати, 
поскольку вся отладочная информация предназначена для программи- 
ста, автора программы, а пользователю может только мешать. Проблема, 
в том, что отладка программы — процесс бесконечный, и как только мы 
решим, что она завершена и удалим из текста всю отладочную печать, 
по закону подлости тут же обнаружится очередная ошибка, и нам вновь 
придётся редактировать наш исходник, чтобы вернуть отладочную пе- 
чать на место. 

Большинство профессиональных компилируемых языков программи- 
рования поддерживают для подобных случаев специальные конструк- 
ции, называемые директивами условной компиляции и позволя- 
ющие выбирать, какие фрагменты программы компилировать, а какие 
игнорировать. Обычно отработку директив условной компиляции возла- 
гают на макропроцессор, если, конечно, таковой в языке предусмотрен. 
Сказанное справедливо, кроме прочего, практически для всех языков ас- 
семблера, включая и наш МАЅМ. 

Рассмотрим пример, связанный с отладкой. Допустим, мы написали 
программу, откомпилировали её и запустили, но она завершается аварий- 
но, и мы не можем понять причину, но думаем, что авария происходит в 
некоем «подозрительном» фрагменте. Чтобы проверить своё предполо- 
жение, мы хотим непосредственно перед входом в этот фрагмент и сразу 
после выхода из него вставить печать соответствующих сообщений. Что- 
бы нам не пришлось по несколько раз стирать эти сообщения и вставлять 
их снова, воспользуемся директивами условной компиляции. Выглядеть 
это будет примерно так: 


ifdef DEBUG_PRINT 
PRINT "Entering suspicious section" 
PUTCHAR 10 

Фепаіғ 

„ 

i здесь идёт "подозрительная" часть программы 


„ 

7іғаеғ DEBUG_PRINT 
PRINT "Leaving suspicious section" 
PUTCHAR 10 
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Фепаіғ 


Здесь ^іғде? — это одна из директив условной компиляции, озна- 
чающая «компилировать только в случае, если определён данный одно- 
строчный макрос» (в данном случае это макрос РЕВОб_РАТМТ). Теперь в 
начало программы следует вставить строку, определяющую этот символ: 


4аеғіпе DEBUG_PRINT 


Тогда при запуске МАЅМ «увидит» и откомпилирует фрагменты наше- 
го исходного текста, заключённые между соответствующими ifdef и 
/епаіғ; когда же мы найдём ошибку и отладочная печать будет нам 
больше не нужна, достаточно будет убрать этот %ае?1пе из начала про- 
граммы или даже поставить перед ним знак комментария: 


;%define DEBUG_PRINT 


и фрагменты, обрамлённые соответствующими директивами, макропро- 
цессор будет попросту игнорировать, так что их можно совершенно спо- 
койно оставить в тексте программы, а не удалять, на случай, если они 
снова понадобятся. 

Забегая вперёд, отметим, что для включения и отключения отладочной пе- 
чати, оформленной таким образом, можно вообще обойтись без правки исходно- 
го текста. Определить макросимвол можно ключом командной строки МАЗМ; в 
частности, включить отладочную печать из нашего примера можно, вызвав NASM 
примерно таким образом: 


nasm -f elf -dDEBUG_PRINT prog.asm 


что избавляет нас от необходимости вставлять в исходный текст директиву 
/ЧеЁ1пе, а потом её удалять. 

Возвращаясь к ситуации с двумя заказчиками, мы можем предусмот- 
реть в программе конструкции, подобные следующей: 


%ї#ае# ЕОВ_РЕТВОУ 
; 
; здесь код, предназначенный только для Петрова 


ЕД 

Ҹе1іғаеғ FOR_SIDOROV 

} 

; а здесь - только для Сидорова 


ЕД 

/е1зе 

; если ни тот символ, ни другой не определены, 

; прервём компиляцию и выдадим сообщение об ошибке 
Хеггог Please define either ЕОВ_РЕТВОУ ог FOR_SIDOROV 
Фепаіғ 
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(директива %elifdef — это сокращённая форма записи для else и 
ifdef). При компиляции такой программы нужно будет обязательно ука- 
зать ключ -аР0В_РЕТВОУ или -dFOR_SIDOROV, иначе NASM начнёт oôpa- 
батывать фрагмент, находящийся после helse, и, встретив директиву 
^етгог, выдаст сообщение об ошибке. 


Кроме проверки наличия макросимвола, можно проверять также и 
факт отсутствия макросимвола (то есть прямо противоположное усло- 
вие). Это делается директивой #1 п4е+ (if not defined). Как и для #1#ае?, 
для %1?пае? существует сокращённая запись конструкции с helse, она 
называется %#е11їпае?. 


Для задания условия, при котором тот или иной фрагмент подлежит 
или не подлежит компиляции, можно пользоваться не только фактом 
наличия или отсутствия макроса; МАЗМ поддерживает и другие дирек- 
тивы условной компиляции. Наиболее общей является директива hif, в 
которой условие задаётся арифметико-логическим выражением, вычис- 
ляемым во время компиляции. С такими выражениями мы уже встре- 
чались в $ 3.4.1; для формирования логических выражений набор допу- 
стимых операций расширяется операциями =, <, >, >=, <=, в их обычном 
смысле, операцию «не равно» можно задать символом <>, как в Паскале, 
или символом !=, как в Си; поддерживается и Си-подобная форма записи 
операции «равно» в виде двух знаков равенства ==. Кроме того, доступ- 
ны логические связки && («и»), || («или») и ^^ («исключающее или»). 
Отметим, что все выражения, используемые в директиве Vif, рассматри- 
ваются как критические (см. $ 3.4.2). Так же, как и для всех остальных 
41#-директив, для простого hif имеется форма сокращённой записи KOH- 
струкции с helse — директива /е11#. 

Перечислим кратко остальные поддерживаемые МАЅМ условные ди- 
рективы. Директивы /іғіар и 4111411 принимают два аргумента, разде- 
лённые запятой, и сравнивают их как строки, предварительно произве- 
дя, если это необходимо, макроподстановки в тексте аргументов. Фраг- 
мент кода, следующий за этими директивами, транслируется только в 
случае, если строки окажутся равными, причём %ifidn требует точ- 
ного совпадения, тогда как /іғійпі игнорирует регистр и считает, Ha- 
пример, строки foobar, FooBar и FOOBAR одинаковыми. Для проверки 
противоположного условия можно использовать директивы /іѓпіап и 
41111901; все четыре директивы имеют %е11+-формы, соответственно, 
Фе1іғіап, ^е1іғіапі, де11Ри1ап и ^е1іғпідпі. Директива /1тасго npo- 
веряет существование многострочного макроса; поддерживаются дирек- 
тивы /1птасго, ^е1 і#тасго и 4е11Рпщасго. Директивы 4іғій, hifstr и 
41 пят проверяют, является ли их аргумент, соответственно, идентифи- 
катором, строкой или числовой константой. Как обычно, МАЗМ поддер- 
живает все дополнительные формы вида %1їпХХХ, /е11 ХХХ и helifnXXX 
для всех трёх директив. 
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Кроме перечисленных, NASM поддерживает директиву 41 с+х и соответству- 
ющие формы, но объяснение её работы достаточно сложно и обсуждать эту ди- 
рективу мы не будем. 


§ 3.5.5. Макроповторения 


При необходимости препроцессор МАЅМ можно заставить многократ- 
но (циклически) обрабатывать один и тот же фрагмент кода. Это до- 
стигается директивами %гер (от слова repetition) и фепагер. Директи- 
ва гер принимает один обязательный параметр, означающий количе- 
ство повторений. Фрагмент кода, заключённый между директивами гер 
и Хепагер, будет обработан макропроцессором (и ассемблером) столько 
раз, сколько указано в параметре директивы #гер. Кроме того, между 
директивами гер и hendrep может встретиться директива йех1%гер, KO- 
торая досрочно прекращает выполнение макроповторения. Рассмотрим 
простой пример. Пусть нам необходимо описать область памяти, состо- 
ящую из 100 последовательных байтов, причём в первом из них должно 
содержаться число 50, во втором — число 51 и т. д., в последнем, соот- 
ветственно, число 149. Конечно, можно просто написать сто строк кода: 


а 50 

а 51 

db 52 

НИ 

а 148 

а 149 
но это, во-первых, утомительно, а во-вторых, занимает слишком много 
места в тексте программы. Гораздо правильнее будет поручить генера- 
цию этого кода макропроцессору, воспользовавшись макроповторением 
и макропеременной: 


%assign п 50 


тер 100 

ар п 
%assign п 0+1 
фепагер 


Встретив такой фрагмент, макропроцессор сначала свяжет с макропе- 
ременной п значение 50, затем сто раз рассмотрит две строчки, заклю- 
чённые между ^гер и фепагер, причём каждое рассмотрение этих строк 
приведёт к генерации очередной подлежащей ассемблированию строки 
аъ 50, db 51, db 52 ит. д.; изменение числа происходит благодаря тому, 
что значение макропеременной п изменяется (увеличивается на единицу) 
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на каждом проходе макроповторения. Иначе говоря, в результате обра- 
ботки макропроцессором этого фрагмента как раз и получатся точно 
такие сто строк кода, как показано выше, и именно они и будут ассем- 
блироваться. Макропроцессор, таким образом, избавляет нас от необхо- 
димости писать эти сто строк вручную. 

Рассмотрим более сложный пример. Пусть имеется необходимость зал 
дать область памяти, содержащую последовательно в виде четырёхбайт- 
ных пелых все числа Фибоначчи, не превосходящие 100000. Сгенериро- 
вать соответствующую последовательность директив дд можно с помо- 
щью такого фрагмента, кода: 


fibonacci 
%assign i 1 
%assign j 1 
Чтер 100000 
%if > 100000 
фех1гер 
endif 


dd j 


%assign k ]+1 
%assign і j 
%assign j k 
фепагер 
fib_count equ ($-fibonacci)/4 


причём метка, fibonacci будет связана с адресом начала сгенерирован- 
ной области памяти, а метка fib_count — с общим количеством чисел, 
размещённых в этой области памяти (с этим приёмом мы уже сталкива- 
лись на стр. 98). 

Использовать макроповторения можно не только для генерации об- 
ластей памяти, заполненных числами, но и для других целей. Пусть 
например, у нас имеется массив из 128 двухбайтовых целых чисел: 


аггау геѕы 128 


и мы хотим написать последовательность из 128 команд inc, увеличива- 
ющих на единицу каждый из элементов этого массива. Можно сделать 
это так: 


%assign а array 


8Напомним, что числа Фибоначчи — это последовательность чисел, начинающаяся 
с двух единиц, каждое следующее число которой получается сложением двух преды- 
дущих: 1, 1, 2, 3, 5, 8, 13, 41, 34 и т. д. 
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тер 128 

іпс мога [а] 
%assign а а+2 
фепагер 


Читатель мог бы отметить, что использование в такой ситуации 128 команд 
нерационально и правильнее было бы воспользоваться циклом во время исполне- 
ния, например, так: 


шоу есх, 128 
1р: іпс мога [аггау + есхж2 - 2] 
1оор 1р 


В большинстве случаев такой вариант действительно предпочтительнее, посколь- 
ку такие три команды, естественно, будут занимать в несколько десятков раз 
меньше памяти, чем последовательность из 128 команд inc, но следует иметь 
в виду, что работать такой код будет примерно в полтора раза медленнее, так 
что в некоторых случаях применение макроцикла для генерации последователь- 
ности одинаковых команд (вместо цикла времени исполнения) может оказаться 
осмысленным. 


6 3.5.6. Многострочные макросы и локальные метки 


Вернёмся теперь к многострочным макросам; такие макросы генери- 
руют не фрагмент строки, а фрагмент текста, состоящий из нескольких 
строк. Описание многострочного макроса также состоит из нескольких 
строк, заключённых между директивами %#%шасго и %endmacro. В 83.5.2 
мы уже рассматривали простейшие примеры многострочных макросов, 
однако в мало-мальски сложном случае рассмотренных средств нам не 
хватит. Пусть, например, мы хотим описать макрос zeromem, принимаю- 
щий на вход два параметра — адрес и длину области памяти — и раскры- 
вающийся в код, заполняющий эту память нулями. Не особенно задумы- 
ваясь над происходящим, мы могли бы написать, например, следующий 
(неправильный!) код: 


Ушасго zeromem 2 ; (два параметра - адрес и длина) 
push ecx 
push esi 
mov ecx, 42 
mov esi, %1 
lp: mov byte [esi], 0 
inc esi 
loop 1p 
pop esi 
pop ecx 
Хепатасго 
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NASM примет такое описание и даже позволит произвести один MaK- 
ровызов. Если же в нашей программе встретятся хотя бы два вызова, 
макроса 2еготет, то при попытке оттранслировать программу мы полу- 
чим сообщение об ошибке — МАЅМ пожалуется на то, что мы используем 
одну и ту же метку (1р:) дважды. Действительно, при каждом макро- 
вызове макропроцессор вставит вместо вызова всё тело нашего макрооп- 
ределения, только заменив %1 и %2 на соответствующие параметры, а всё 
остальное сохранив без изменения. Значит, строка, 


1р: mov byte [esi], 0 


содержащая метку lp, встретится ассемблеру (уже после макропроцес- 
сирования) дважды — или, точнее, ровно столько раз, сколько раз будет 
вызван макрос 2еготет. 

Ясно, что необходим некий механизм, позволяющий локализовать 
метку, используемую внутри многострочного макроса, с тем, чтобы такие 
метки, полученные вызовом одного и того же макроса в разных местах 
программы, не конфликтовали друг с другом. В МАЗМ такой механизм 
называется «локальные метки в макросах». Чтобы задействовать этот 
механизм, необходимо начать имя метки с двух символов % — так, в при- 
ведённом выше примере оба вхождения метки 1р нужно заменить на 
%Л1р. Такая метка будет в каждом следующем макровызове заменяться 
некоторым новым (не повторяющимся) идентификатором. Отметим для 
наглядности, что при первом вызове макроса zeromem NASM заменит 
1%1р на ..01.1р, при втором — на ..@2.1рит.д. 

Отметим ещё один недостаток вышеприведённого определения хеготеш. Ec- 
ли при вызове этого макроса пользователь (программист, пользующийся нашим 
макросом, или, возможно, мы сами) использует в качестве первого параметра (ад- 
реса начала области памяти) регистр ЕСХ или в качестве второго (длины области 
памяти) — регистр ESI, макровызов будет успешно оттранслирован, но работать 
программа будет совсем не так, как от неё ожидается. Действительно, если напи- 
сать что-то вроде 


section .Бѕѕ 
array resb 256 
arr_len equ $-array 


section .text 

5 
mov ecx, array 
mov esi, arr_len 
zeromem ecx, esi 


; 
то начало макроса zeromem развернётся в следующий код: 


push ecx 
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push esi 
mov ecx, esi 
mov esi, ecx 


> 


в результате чего, очевидно, B обоих регистрах ЕСХ и ЕЗТ окажется длина массива, 
а адрес его начала будет потерян. Скорее всего, программа в таком виде аварийно 
завершится, дойдя до этого фрагмента кода. 

Чтобы избежать подобных проблем, можно воспользоваться директивами 
условной компиляции, проверяя, не является ли первый параметр регистром ЕСХ 
и не является ли второй параметр регистром ESI, но можно поступить и проще — 
загрузить значения параметров в регистры через временную запись их в стек, то 
есть вместо 


mov ecx, 42 
mov esi, %1 


написать 


push dword %2 
push dword %1 
pop esi 
pop ecx 


Окончательно наше макроопределение примет следующий вид: 


#шасго zeromem 2 ; (два параметра - адрес и длина) 
push ecx 
push esi 
push dword %2 
push dword %1 
pop esi 
pop ecx 
hlp: шоу byte [esi], 0 
inc esi 
loop //1р 
pop esi 
pop ecx 
Жепашасго 


§ 3.5.7. Макросы с переменным числом параметров 


При описании многострочных макросов с помощью директивы ўтасго 
ассемблер МАЗМ позволяет задать переменное число параметров. Это 
делается с помощью символа, -, который в данном случае символизирует 
тире. Например, директива, 


Ушасго шушасго 1-3 
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задаёт макрос, принимающий от одного до трёх параметров, а директива 
Ушасго шузесопатасго 2-* 


задаёт макрос, допускающий произвольное количество параметров, не 
меньшее двух. При работе с такими макросами может оказаться полез- 
ным обозначение %0, вместо которого макропроцессор во время макро- 
подстановки подставляет число, равное фактическому количеству пара- 
метров. 

Напомним, что сами аргументы многострочного макроса в его те- 
ле обозначаются как %1, %2 и т.д., но средств индексирования (то есть 
способа извлечь п-ый параметр, где п вычисляется уже во время MaK- 
роподстановки) МАЅМ не предусматривает. Как же в таком случае ис- 
пользовать параметры, если даже их количество заранее не известно? 
Проблему решает директива /гофафе, позволяющая переобозначить па- 
раметры. Рассмотрим самый простой вариант директивы: 


Утофафе 1 


Числовой параметр обозначает, на сколько позиций следует сдвинуть но- 
мера параметров. В данном случае это число 1, так что параметр, ранее 
обозначавшийся 42, после этой директивы будет иметь обозначение %1, 
в свою очередь бывший %3 превратится в 42 и т.д., ну а параметр, CTO- 
явший самым первым и имевший обозначение %1, в силу «цикличности» 
нашего сдвига получит номер, равный общему количеству параметров. 
Обозначение 70 в ротации не участвует и никак не изменяется. 

Директива, позволяет производить циклический сдвиг и в обратном 
направлении (влево), для этого следует задать её параметр отрицатель- 
ным. Так, после отработки директивы 


Утофафе -1 


41 будет обозначать параметр, ранее стоявший самым последним, %2 ста- 
нет обозначать параметр, ранее бывший первым (то есть имевший обо- 
значение 41) ит.д. 

Вспомним, что ранее (см. стр. 105) мы обещали написать макрос 
рса11, позволяющий в одну строчку сформировать вызов подпрограм- 
мы с любым количеством аргументов. Сейчас, имея в своём распоряже- 
нии макросы с переменным числом аргументов и директиву /гофафе, мы 
готовы это сделать. Наш макрос, который мы назовём просто рса11, бу- 
дет принимать на вход адрес процедуры (аргумент для команды call) и 
произвольное количество параметров, предназначенное для размещения 
в стеке. Мы будем, как и раньше, предполагать для простоты, что каж- 
дый параметр занимает ровно 4 байта. Напомним, что параметры долж- 
ны быть помещены в стек в обратном порядке, начиная с последнего. Мы 
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добьёмся этого с помощью макроцикла Arep и директивы Ўго+аёе -1, 
которая на каждом шаге будет делать последний (на текущий момент) 
параметр параметром номер 1. Количество итераций цикла на единицу 
меньше, чем количество параметров, переданных в макрос, потому что 
первый из параметров является именем процедуры и его в стек заносить 
не надо. После этого цикла нам останется снова превратить последний 
параметр в первый (на этот раз это как раз и окажется самый первый 
из всех параметров, то есть адрес процедуры) и сделать са11, а затем 
вставить команду ада для очистки стека от параметров. Итак, пишем: 


Ушасго рса11 1-* ; от одного до скольки угодно 


Arep %0 - 1 ; цикл по всем параметрам кроме первого 
Утофафе -1 ; последний параметр становится %1 

push амога %1 

фепагер 

rotate -1 ; адрес процедуры становится %1 
call %1 
add esp, (40 - 1) ж 4 

фепдшасго 


Если теперь вызвать этот макрос, например, вот так: 
рса11 шургос, eax, myvar, 27 
то результатом подстановки станет следующий фрагмент: 


ривһ амога 27 
push Амога myvar 
push dword eax 
call myproc 

add esp, 12 


что, собственно, нам и требовалось. 


$3.5.8. Макродирективы для работы со строками 


Ассемблер МАЅМ поддерживает две директивы, предназначенные для преоб- 
разования строк (строковых констант) во время макропроцессирования. Они мо- 
гут оказаться полезными, например, внутри многострочного макроса, одним из 
параметров которого является (должна быть) строка и с этой строкой необходимо 
предварительно выполнить те или иные преобразования. 

Первая из директив, #в%г1еп‚ позволяет определить длину строки. Директива 
имеет два параметра. Первый из них — имя макропеременной, которой следу- 
ет присвоить число, соответствующее длине строки, ну а второй — собственно 
строка. Так, в результате выполнения 


Astrlen sl ’my string’ 
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макропеременная 51 получит значение 9. 
Вторая директива, /зиЪз%г, позволяет выделить из строки символ с заданным 
номером. Например, после выполнения 


/ѕоЫѕіг vari ?аБса? 1 
%вцбвїг уаг2 ’abcd’ 2 
/ѕорѕіг var3 ’abcd’ 3 


макропеременные vari, уаг2 и var3 получат значения ?а?, ?Ь? и ?с? соответ- 
ственно, то есть произойдёт то же самое, как если бы мы написали 


/деҒіпе vari а? 
/дӢеҒіпе var2 ?Ъ? 


/деҒіпе var3 ?с? 


Всё это имеет смысл, как правило, только в случае, если в качестве аргумента 
директивы получают либо имя макропеременной, либо обозначение позиционного 
параметра в многострочном макросе. 

Напомним, что все макродирективы отрабатывают во время макропроцесси- 
рования (перед компиляцией, то есть задолго до выполнения нашей программы), 
так что, разумеется, на момент соответствующих макроподстановок все исполь- 
зуемые строки должны быть уже известны. 


$3.6. Командная строка МАЗМ 


Рассказ об ассемблере МАЅМ мы завершаем кратким обзором аргу- 
ментов его командной строки. Как уже говорилось, при вызове програм- 
мы пази необходимо указать имя файла, содержащего исходный текст на 
языке ассемблера, а кроме этого, обычно требуется указать ключи, зада- 
ющие режим работы. С некоторыми из них мы уже знакомы: это ключи 
-f, -o и -9. 

Напомним, что ключ -f позволяет указать формат получаемого KO- 
да. В нашем случае всегда используется формат е1#. Интересно, что, 
если не указать этот ключ, ассемблер создаст выходной файл в «сыром» 
формате, то есть, попросту говоря, переведёт наши команды в двоичное 
представление и в таком виде запишет в файл. Работая под управлени- 
ем операционных систем, мы такой файл запустить на выполнение не 
сможем, однако если бы мы, к примеру, хотели написать программу для 
размещения в загрузочном секторе диска, то «сырой» формат оказался 
бы как раз тем, что нам нужно. 

Ключ -о задаёт имя файла, в который следует записать результат 
трансляции. Если мы используем формат elf, то вполне можем доверить 
выбор имени файла самому МАЗМГу: он отбросит от имени исходного 
файла суффикс .азт и заменит его на .о, что нам в большинстве случаев 
и требуется. Если же по каким-то причинам нам удобнее другое имя, мы 
можем указать его явно с помощью -о. 
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Ключ -d, как мы уже знаем (см. стр. 112), используется для определе- 
ния макросимвола в случае, если мы не хотим делать этого путём редак- 
тирования исходного текста. Мы использовали его в форме -а5ҮМВбГ, 
что даёт тот же эффект, как если в начало программы вставить стро- 
ку define SYMBOL. Но можно использовать его и для задания значе- 
ния макросимвола: например, -4517Е=1024 не только определит символ 
SIZE, но и припишет ему значение 1024, как это сделала бы директива 
%define SIZE 1024. 

Очень интересны в познавательном плане возможности генерации так 
называемого листинга — подробного отчёта ассемблера о проделанной 
работе. Листинг включает в себя строки исходного кода, снабжённые 
информацией об используемых адресах и о том, какой итоговый код сге- 
нерирован в результате обработки каждой исходной строки. Генерация 
листинга, запускается ключом -1, после которого требуется указать имя 
файла. Для примера, возьмите любую программу на языке ассемблера и 
оттранслируйте её с флагом -1; так, если ваша программа называется 
ргоё.азш, попробуйте применить команду 


nasm -f elf -l prog.lst prog.asm 


в результате которой текст листинга будет помещён в файл prog.lst; 
обязательно просмотрите получившийся файл и задайте вашему препо- 
давателю вопросы по поводу всего, что в листинге оказалось непонятно. 

Весьма полезным может оказаться ключ -&, указывающий МАЗМ’у 
на необходимость включения в результаты трансляции так называемой 
отладочной информации. При указании этого ключа МАЗМ вставляет 
в объектный файл помимо объектного кода ещё и сведения об имени 
исходного файла, номерах строк в нём и т. п. Для работы программы вся 
эта информация совершенно бесполезна, тем более что по объёму она 
может в несколько раз превышать «полезный» объектный код. Однако 
в случае, если ваша программа работает не так, как вы от неё ожидаете, 
компиляция с флажком -5 позволит вам воспользоваться отладчиком 
(например, gdb) для пошагового выполнения программы, что, в свою 
очередь, даст возможность разобраться в происходящем. 

Ещё один полезный ключ — -е; он предписывает МАЅМ”у прогнать 
наш исходный код через макропроцессор, выдать результат в поток стан- 
дартного вывода (попросту говоря, на экран) и на этом успокоиться. 
Такой режим работы может оказаться полезен, если мы ошиблись при 
написании макроса и никак не можем понять, в чём наша ошибка заклю- 
чается; увидев результат макропроцессирования нашей программы, мы, 
скорее всего, сможем понять, что и почему пошло не так. 

NASM поддерживает и другие ключи командной строки; желающие 
могут изучить их самостоятельно, обратившись к документации. 


122 


Глава 4. Взаимодействие с 
операционной системой 


В этой главе мы рассмотрим средства взаимодействия пользователь- 
ской программы с операционной системой, что позволит в дальнейшем 
отказаться от использования макросов из файла stud_io.inc, а при же- 
лании и самостоятельно создавать их аналоги. 

Пользовательские задачи обращаются к ядру операционной системы, 
используя так называемые системные вызовы, которые, в свою оче- 
редь, реализованы через механизм программных прерываний. Tro- 
бы понять, что это такое, нам придётся подробно обсудить, что такое 
прерывания, какие они бывают и для чего служат, поэтому первые два 
параграфа, этой главы мы посвятим изложению необходимых теоретиче- 
ских сведений, и лишь затем, имея готовую базу, рассмотрим механизм 
системных вызовов операционных систем Linux и FreeBSD на уровне ma- 
шинных команд. 


$ 4.1. Мультизадачность и её основные виды 


§ 4.1.1. Понятие одновременности выполнения 


Как уже говорилось во введении, мультизадачност или режим 
мультипрограммирования — это такой режим работы вычислительной 
системы, при котором несколько программ могут выполняться в системе 
одновременно. Для этого, вообще говоря, не нужно несколько физиче- 
ских процессоров. Вычислительная система может иметь всего один про- 
пессор, что не мешает само по себе реализации режима мультипрограм- 
мирования. Так или иначе, количество процессоров в системе в общем 
случае меньше количества, одновременно выполняемых программ. Ясно, 
что процессор в каждый момент времени может выполнять только од- 
ну программу. Что же, в таком случае, понимается под мультипрограм- 
мированием? Кажущийся парадокс разрешается введением следующего 
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Задача 1 


Рис. 4.1. Одновременное выполнение задач на одном процессоре 


определения одновременности, для случая выполняющихся программ 
(процессов, или задач): 

Две задачи, запущенные на одной вычислительной системе, 
называются выполняемыми одновременно, если периоды их вы- 
полнения (временнбй отрезок с момента запуска до момента 
завершения каждой из задач) полностью или частично пере- 
крываются. Иными словами, если процессор, работая в каждый момент 
времени с одной задачей, при этом переключается между несколькими 
задачами, уделяя внимание то одной из них, то другой, эти задачи в 
соответствии с нашим определением будут считаться выполняемыми од- 
новременно (см. рис. 4.1). 


6 4.1.2. Пакетный режим 


В простейшем случае мультизадачность позволяет решить пробле- 
му простоя центрального процессора во время операций ввода-вывода. 
Представим себе вычислительную систему, в которой выполняется одна, 
задача (например, обсчет сложной математической модели). В некото- 
рый момент времени задаче может потребоваться операция обмена дан- 
ными с каким-либо внешним устройством (например, чтение очередного 
блока входных данных либо, наоборот, запись конечных или промежу- 
точных результатов). 

Скорость работы внешних устройств (дисков и т.п.) обычно на по- 
рядки ниже, чем скорость работы центрального процессора, и в любом 
случае никоим образом не бесконечна. Так, для чтения заданного блока 
данных с диска необходимо включить привод головки, чтобы переме- 
стить её в нужное положение (на нужную дорожку) и дождаться, пока 
сам диск повернётся на нужный угол (для работы с заданным секто- 
ром); затем, пока, сектор проходит под головкой, прочитать записанные 
в этом секторе данные во внутренний буфер контроллера диска!; нако- 
нец, следует разместить прочитанные данные в той области памяти, где 


1 Чтение непосредственно в оперативную память теоретически возможно, но тех- 
нически сопряжено с определенными трудностями и применяется редко. 
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работа ожидание (простой) работа 


Рис. 4.2. Простой процессора в однозадачной системе 


задача 1 блокировка ГОТОВНОСТЬ задача 1 
ЕЕ Я ЫМ— 


задача 2 
ум— ——= 


Рис. 4.3. Пакетная ОС 


их появления ожидает пользовательская программа, и лишь после этого 
вернуть ей управление. Всё это время (как минимум, время, затрачивае- 
мое на перемещение головки и ожидание нужной фазы поворота диска) 
центральный процессор будет простаивать (рис. 4.2). Если задача у нас 
всего одна и больше делать нечего, такой простой не создаёт проблем, 
но если кроме той задачи, которая уже работает, у нас есть и другие 
задачи, дожидающиеся своего часа, то лучше бы было употребить время 
центрального процессора, впустую пропадающее в ожидании окончания 
операций ввода-вывода, на решение других задач. Именно так поступа- 
ют мультизадачные операционные системы. В такой системе из задач, 
которые нужно решать, формируется очередь заданий. Как только ак- 
тивная задача, затребует проведение операции ввода-вывода, операцион- 
ная система выполняет необходимые действия по запуску контроллеров 
устройств на исполнение запрошенной операции либо ставит запрошен- 
ную операцию в очередь, если начать её немедленно по каким-то причи- 
нам нельзя, после чего активная задача заменяется на другую — новую 
(взятую из очереди) или уже выполнявшуюся раньше, но не успевшую 
завершиться. Замененная задача в этом случае считается перешедшей в 
состояние ожидания результата ввода-вывода, или состояние блоки- 
ровки. 


125 


В простейшем случае новая активная задача, остается в режиме вы- 
полнения до тех пор, пока она не завершится либо не затребует, в свою 
очередь, проведение операции ввода-вывода. При этом блокированная 
задача по окончании операции ввода-вывода переходит из состояния бло- 
кировки в состояние готовности к выполнению, но переключения 
на нее не происходит (см. рис. 4.3); это обусловлено тем, что операция 
смены активной задачи, вообще говоря, отнимает много процессорного 
времени. Такой способ построения мультизадачности, при котором смена 
активной задачи происходит только в случае ее окончания или запроса, 
на операцию ввода-вывода, называется пакетным режимом?, а, опе- 
рационные системы, реализующие этот режим, — пакетными опера- 
ционными системами. Режим пакетной мультизадачности являет- 
ся самым эффективным с точки зрения использования вычислительной 
мощности центрального процессора, поэтому именно пакетный режим 
используется для управления суперкомпьютерами и другими машинами, 
основное назначение которых — большие объемы численных расчетов. 


8 4.1.3. Режим разделения времени 


С появлением первых терминалов и диалогового (иначе говоря, ин- 
терактивного) режима работы с компьютерами возникла потребность в 
других стратегиях смены активных задач, или, как принято говорить, 
планирования времени центрального процессора. Действитель- 
но, пользователю, ведущему диалог с той или иной программой, вряд ли 
захочется ждать, пока некая активная задача, вычисляющая, скажем, 
обратную матрицу порядка 1000х1000, завершит свою работу. При этом 
много процессорного времени на обслуживание диалога с пользователем 
не требуется: в ответ на каждое действие пользователя (например, на- 
жатие на клавишу) обычно необходимо выполнить набор действий, укла- 
дывающийся в несколько миллисекунд, тогда как самих таких событий 
пользователь даже в режиме активного набора текста может создать ни- 
как не больше трех-четырех в секунду (скорость компьютерного набора 
200 символов в минуту считается очень высокой). Соответственно, бы- 
ло бы нелогично ждать, пока пользователь полностью завершит свой 
диалоговый сеанс: большую часть времени процессор мог бы произво- 
дить арифметические действия, необходимые для задачи, вычисляющей 
матрицу. Решить проблему позволяет режим разделения времени. 
В этом режиме каждой задаче отводится определенное время работы, 


Русскоязычный термин «пакетный режим» является устоявшимся, хотя и не 
слишком удачным переводом английского термина «Ьа{сһ mode»; слово batch Mox- 
но также перевести как «колода» (собственно, изначально имелись в виду колоды 
перфокарт, олицетворявшие задания). Не следует путать этот термин со словами, 
происходящими от английского слова packet, которое тоже обычно переводится на 
русский как «пакет». 
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называемое квантом времени. По окончании этого кванта, если в си- 
стеме имеются другие готовые к исполнению задачи, активная задача, 
принудительно приостанавливается и заменяется другой задачей. При- 
остановленная задача помещается в очередь задач, готовых к вы- 
полнению и находится там, пока остальные задачи отработают свои 
кванты; затем она снова получает очередной квант времени для работы, 
и т. д. Естественно, если активная задача, затребовала операцию ввода- 
вывода, она переводится в состояние блокировки (точно так же, как и 
в пакетном режиме). Задачи, находящиеся в состоянии блокировки, не 
ставятся в очередь на выполнение и не получают квантов времени до 
тех пор, пока операция ввода-вывода не будет завершена (либо не ис- 
чезнет другая причина блокировки), и задача не перейдет в состояние 
готовности к выполнению. 

Существуют различые алгоритмы поддержки очереди на выполнение, 
в том числе и такие, в которых задачам приписывается некоторый прио- 
ритет, выраженный числом. Например, в ОС Unix обычно задача имеет 
две составляющие приоритета — статическую и динамическую; статиче- 
ская составляющая представляет собой заданный администратором уро- 
вень «важности» выполнения данной конкретной задачи, динамическая 
же изменяется планировщиком: пока задача находится в стадии выпол- 
нения, её динамический приоритет падает, когда же задача, находится 
в очереди на исполнение, динамическая составляющая приоритета, на- 
против, растёт. Из нескольких готовых к исполнению задач выбирается 
имеющая наибольшую сумму приоритетов, так что рано или поздно зада- 
ча даже с самым низким статическим приоритетом получит управление 
за, счет возросшего динамического приоритета. 

Некоторые операционные системы, включая ранние версии Windows, применя- 
ли стратегию, занимающую промежуточное положение между пакетным режимом 
и режимом разделения времени. В этих системах задачам выделялся квант вре- 
мени, как и в системах разделения времени, но принудительной смены текущей 
задачи по истечении кванта времени не производилось; система проверяла, не 
истек ли квант времени у текущей задачи, только когда задача обращалась к опе- 
рационной системе за какими-либо услугами (не обязательно за вводом-выводом). 
Таким образом, задача, не нуждающаяся в услугах операционной системы, мог- 
ла оставаться на процессоре сколь угодно долго, как и в пакетных операционных 
системах. Такой режим работы называется невытесняющим. В современных си- 
стемах он не применяется, поскольку налагает слишком жесткие требования на 
исполняемые в системе программы; так, в ранних версиях Windows любая npo- 
грамма, занятая длительными вычислениями, блокировала работу всей системы. 


8 4.1.4. Режим реального времени 


Иногда режим разделения времени также оказывается непригоден. В некото- 
рых ситуациях, таких как управление полетом самолета, ядерным реактором, ав- 
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томатической линией производства и т. п., некоторые задачи должны быть завер- 
шены строго до определенного момента времени; так, если автопилот самолета, 
получив сигнал от датчиков тангажа и крена, потратит на вычисление необхо- 
димого корректирующего воздействия больше времени, чем допустимо, самолет 
может вовсе потерять управление. 

В случае, когда выполняемые задачи (как минимум некоторые из них) имеют 
жесткие рамки по необходимому времени завершения, применяются операцион- 
ные системы реального времени. В отличие от систем разделения времени, за- 
дача планировщика реального времени не в том, чтобы дать всем программам 
отработать некоторое время, а в том, чтобы обеспечить завершение каждой за- 
дачи за отведённое ей время, если же это невозможно — снять задачу, освободив 
процессор для тех задач, которые ещё можно успеть завершить к сроку. 


6 4.1.5. Аппаратная поддержка мультизадачности 


Ясно, что для построения мультизадачного режима работы вычисли- 
тельной системы аппаратура (прежде всего сам пентральный процессор) 
должна обладать определенными свойствами. О некоторых из них мы 
уже говорили в $ 1.2 — это, во-первых, защита памяти, а во-вторых, раз- 
деление машинных команд на обычные и привилегированные, с отклю- 
чением возможности выполнения привилегированных команд в ограни- 
ченном режиме работы центрального процессора. 

Действительно, при одновременном нахождении в памяти машины 
нескольких программ, если не предпринять специальных мер, одна из 
программ может модифицировать данные или код других программ или 
самой операционной системы. Даже если допустить отсутствие злого 
умысла у разработчиков всех запускаемых программ, от случайных оши- 
бок в программах нас это допущение не спасет, причём такая ошибка 
может, с одной стороны, привести к тяжелым авариям всей системы, а с 
другой стороны — оказаться совершенно неуловимой, вплоть до абсолют- 
ной невозможности установить, какая из задач «виновата» в происходя- 
щем. Дело в том, что для обнаружения и устранения ошибки необходима 
возможность воссоздания обстоятельств, при которых эта ошибка про- 
является, а точно воссоздать состояние всей системы со всеми запущен- 
ными в ней задачами практически невозможно. Очевидно, необходимы 
средства ограничения возможностей работающей программы по доступу 
к областям памяти, занятым другими программами. Программно такую 
защиту можно реализовать разве что путем интерпретации всего машин- 
ного кода исполняющейся программы, что, как правило, недопустимо из 
соображений эффективности. Таким образом, необходима аппаратная, 
поддержка защиты памяти, позволяющая ограничить возможности те- 
кущей задачи по доступу к оперативной памяти. 

Коль скоро существует защита памяти, процессор должен иметь Ha- 
бор команд для управления этой защитой. Если, опять-таки, не пред- 
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принять специальных мер, то такие команды сможет исполнить любая 
из выполняющихся программ, сняв защиту памяти или модифицировав 
ее конфигурацию, что сделало бы саму защиту памяти практически бес- 
смысленной. Рассматриваемая проблема касается не только защиты па- 
мяти, но и работы с внешними устройствами. Как уже говорилось, что- 
бы обеспечить нормальное взаимодействие всех программ с устройства- 
ми ввода-вывода, операционная система должна взять непосредственную 
работу с устройствами на себя, а пользовательским программам предо- 
ставлять интерфейс для обращения к операционной системе за услугами 
по работе с устройствами, причём пользовательские программы долж- 
ны иметь возможность работы с внешними устройствами только через 
операционную систему. Соответственно, необходимо запретить пользо- 
вательским программам выполнение команд процессора, осуществляю- 
щих чтение/запись портов ввода-вывода. Вообще, передавая управление 
пользовательской программе, операционная система должна быть уве- 
рена, что задача не сможет (иначе как путем обращения к самой опера- 
ционной системе) выполнить никакие действия, влияющие на систему в 
целом. 

Проблема решается введением двух режимов работы центрально- 
го процессора: привилегированного и ограниченного. В литературе 
привилегированный режим часто называют «режимом ядра» или «режи- 
мом супервизора» (англ. kernel mode, supervisor mode). Ограничен- 
ный режим называют также «пользовательским режимом» (англ. изет 
mode) или просто непривилегированным (англ. nonprivileged). Tep- 
мин ограниченный режим избран в нами как наиболее точно ONM- 
сывающий сущность этого режима работы центрального процессора, без 
привязки к его использованию операционными системами. В привиле- 
гированном режиме процессор может выполнять любые существующие 
команды. В ограниченном режиме выполнение команд, влияющих на CH- 
стему в целом, запрещено; разрешаются только команды, эффект кото- 
рых ограничен модификацией данных в областях памяти, не закрытых 
защитой памяти. Сама операционная система выполняется в привилеги- 
рованном режиме, пользовательские программы — в ограниченном. 

Как мы уже отмечали в $ 1.2, пользовательская программа может 
только модифицировать данные в отведённой ей памяти; любые другие 
действия требуют обращения к операционной системе. Это обеспечива- 
ется поддержкой в центральном процессоре механизма защиты памяти 
и наличием ограниченного режима работы. Соблюдения этих двух аппа- 
ратных требований, однако, ещё не достаточно для реализации мульти- 
задачного режима работы системы. 

Вернемся к ситуации с операцией ввода-вывода. В однозадачной си- 
стеме (рис. 4.2 на стр. 125) во время исполнения операции ввода-вывода 
центральный процессор мог непрерывно опрашивать контроллер устрой- 
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ства, на предмет его готовности (завершена ли требуемая операция), по- 
сле чего произвести необходимые действия по подготовке к возобновле- 
нию работы активной задачи — в частности, скопировать прочитанные 
данные из буфера контроллера в область памяти, в которой задача ожи- 
дает появления данных. Следует отметить, что в этом случае процессор 
был бы непрерывно занят во время операции ввода-вывода, несмотря на 
то, что никаких полезных вычислений он при этом не производил. Такой 
способ взаимодействия называется активным ожиданием. Ясно, что 
активное ожидание неэффективно, так как процессорное время можно 
было бы использовать с ббльшей пользой. При переходе к мультизадач- 
ной обработке, показанной на рис. 4.3 на стр. 125, возникает определенная 
проблема. В момент завершения операции ввода-вывода, процессор занят 
исполнением второй задачи. Между тем, в момент завершения операции 
требуется как минимум перевести первую задачу из состояния блоки- 
ровки в состояние готовности; более того, могут потребоваться и другие 
действия, такие как копирование данных из буфера контроллера, сброс 
контроллера (например, выключение мотора диска), а в более сложных 
ситуациях — инициирование другой операции ввода-вывода, ранее от- 
ложенной (это может быть операция чтения с того же диска, которую 
затребовала другая задача в то время, как первая операция еще выпол- 
нялась). Проблема состоит в том, каким образом операционная система 
узнает о завершении операции ввода-вывода, если процессор при этом 
занят выполнением другой задачи и непрерывного опроса контроллера 
не производит. 


Решить проблему позволяет аппарат прерываний. В данном кон- 
кретном случае в момент завершения операции контроллер подает цен- 
тральному процессору определенный сигнал (электрический импульс), 
называемый запросом прерывания. Центральный процессор, получив 
этот сигнал, прерывает выполнение активной задачи и передает управле- 
ние процедуре операционной системы, которая выполняет все действия, 
необходимые по окончании операции ввода-вывода. Такая процедура на- 
зывается обработчиком прерывания. После завершения процедуры- 
обработчика управление возвращается активной задаче. 


Для реализации пакетного мультизадачного режима достаточно, что- 
бы на уровне аппаратуры были реализованы прерывания, защита памяти 
и два режима работы процессора. Если же необходимо реализовать си- 
стему разделения времени или реального времени, требуется наличие в 
аппаратуре еще одного компонента — таймера. Действительно, пла- 
нировщику операционной системы разделения времени нужна возмож- 
ность отслеживания истечения квантов времени, выделенных пользова- 
тельским программам; в системе реального времени такая возможность 
также необходима, причем требования к ней даже более жёсткие: не сняв 
вовремя с процессора активное на тот момент приложение, планировщик 
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рискует не успеть выделить более важным программам необходимое им 
процессорное время, в результате чего могут наступить неприятные по- 
следствия (вспомните пример с автопилотом самолёта). Таймер пред- 
ставляет собой сравнительно простое устройство, вся функциональность 
которого сводится к генерации прерываний через равные промежутки 
времени. Эти прерывания дают возможность операционной системе по- 
лучить управление, проанализировать текущее состояние имеющихся за- 
дач и при необходимости сменить активную задачу. 

Итак, для реализации мультизадачной операционной системы аппа- 
ратное обеспечение компьютера обязано поддерживать: 


è аппарат прерываний; 
ө защиту памяти; 


® привилегированный и ограниченный режимы работы центрального 
процессора; 


® таймер. 


Первые три свойства необходимы в любой мультизадачной системе, по- 
следнее может отсутствовать в случае пакетной планировки (хотя в ре- 
ально существующих системах таймер присутствует всегда). Следует об- 
ратить внимание, что из перечисленных свойств только таймер является 
отдельным устройством, остальные три представляют собой особенности 
центрального процессора. 

Теоретически при наличии таймера можно сделать прерывание по таймеру 
единственным прерыванием в системе. В этом случае операционная система, по- 
лучив управление в результате такого прерывания, должна будет уже сама опро- 
сить все активные контроллеры внешних устройств на предмет завершения вы- 
полнявшихся операций, а также проверить, не находится ли активная задача в 
каком-то «специальном» состоянии, обозначающем потребность в системном вы- 
зове. Реально такая схема порождает множество проблем, прежде всего с эффек- 
тивностью, а выигрыш от её применения неочевиден. 


$ 4.2. Виды прерываний 


Современный термин «прерывание» довольно далеко ушел в своем 
развитии от изначального значения; начинающие программисты часто с 
удивлением обнаруживают, что некоторые прерывания вовсе ничего не 
прерывают. Дать строгое определение прерывания было бы несколько 
затруднительно. Вместо этого попытаемся объяснить сущность различ- 
ных видов прерываний и найти между ними то общее, что и оправдывает 
существование самого термина. 
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8 4.2.1. Внешние (аппаратные) прерывания 


Прерывания в изначальном смысле уже знакомы нам из предыдуще- 
го параграфа. Те или иные устройства, вычислительной системы могут 
осуществлять свои функции независимо от центрального процессора; в 
этом случае им может время от времени требоваться внимание опера- 
ционной системы, но единственный центральный процессор (или, что 
ничуть не лучше, все имеющиеся в системе центральные процессоры) 
может быть именно в такой момент занят обработкой пользовательской 
программы. Аппаратные (или внешние) прерывания были призваны pe- 
шить эту проблему. Для поддержки аппаратных прерываний процессор 
имеет специально предназначенные для этого контакты; электрический 
импульс, поданный на такой контакт, воспринимается процессором как 
сигнал о том, что некоторому устройству требуется внимание операцион- 
ной системы. В современных архитектурах, основанных на общей шине, 
для запроса, прерывания используется одна из дорожек шины. 

Последовательность событий при возникновении и обработке преры- 
вания выглядит приблизительно следующим образом?: 


1. Устройство, которому требуется внимание процессора, устанавли- 
вает на шине сигнал «запрос прерывания». 


2. Процессор доводит выполнение текущей программы до такой точ- 
ки, в которой выполнение можно прервать так, чтобы потом вос- 
становить его с того же места; после этого процессор выставляет на 
шине сигнал «подтверждение прерывания». При этом другие пре- 
рывания блокируются. 


3. Получив подтверждение прерывания, устройство передает по шине 
некоторое число, идентифицирующее данное устройство; это число 
называют номером прерывания. 


4. Процессор сохраняет где-то (обычно в стеке активной задачи) те- 
кущие значения счетчика команд и регистра флагов; это называл 
ется малым упрятыванием. Счетчик команд и регистр флагов 
должны быть сохранены по той причине, что выполнение первой 
же инструкции обработчика прерывания изменит (испортит) и то, 
и другое, сделав невозможным прозрачный (т.е. незаметный для 
пользовательской задачи) возврат из обработчика; остальные реги- 
стры обработчик прерывания может при необходимости сохранить 
самостоятельно. 


5. Устанавливается привилегированный режим работы центрального 
процессора, после чего управление передается на точку входа про- 


3Здесь приводится общая схема; в действительности все намного сложнее. 
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цедуры в операционной системе, называемой, как мы уже говори- 
ли, обработчиком прерывания. Адрес обработчика может быть 
предварительно считан из специальных областей памяти, либо вы- 
числен иным способом. 


Напомним, что переключение из привилегированного режима работы 
центрального процессора в ограниченный можно осуществить простой 
командой, поскольку в привилегированном режиме доступны все воз- 
можности процессора; в то же время, переход из ограниченного (пользо- 
вательского) режима обратно в привилегированный произвести с помо- 
щью обычной команды нельзя, поскольку это лишило бы смысла само 
существование привилегированного и ограниченного режимов. В этом 
плане прерывание интересно ещё и тем, что при его возникно- 
вении режим работы центрального процессора становится при- 
вилегированным. 


8 4.2.2. Внутренние прерывания (ловушки) 


Чтобы понять, о чем пойдет речь в этом параграфе, рассмотрим сле- 
дующий вопрос: что следует делать центральному процессору, если ак- 
тивная задача выполнила целочисленное деление на ноль? Ясно, что 
дальнейшее выполнение программы лишено смысла: результат деления 
на ноль невозможно представить каким-либо целым числом, так что в 
переменной, которая должна была содержать результат произведённо- 
го деления, в лучшем случае будет содержаться мусор; соответственно, 
и конечные результаты, скорее всего, окажутся иррелевантными. Пы- 
таться оповестить программу о происшедшем путем выставления какого- 
нибудь флага, очевидно, также бессмысленно. Если программист не про- 
извел перед выполнением деления проверку делителя на равенство ну- 
лю, представляется и вовсе ничтожной вероятность того, что он станет 
проверять после деления значение какого-то флага. 

Завершить текущую задачу процессор самостоятельно не может. Это 
слишком сложное действие, зависящее от реализации операционной си- 
стемы. Остается только один вариант: передать управление операцион- 
ной системе, известив её о происшедшем. Что делать с аварийной зада- 
чей, операционная система решит самостоятельно. Для этого требуется, 
очевидно, переключиться в привилегированный режим и передать управ- 
ление коду операционной системы; перед этим желательно сохранить ре- 
гистры (хотя бы счётчик команд и регистр флагов); даже если задача 
ни при каких условиях не будет продолжена с того же места (а предпо- 
лагать это процессор, вообще говоря, не вправе), значения регистров в 
любом случае могут пригодиться операционной системе для анализа, про- 
исшествия. Более того, каким-то образом следует сообщить операцион- 
ной системе о причине того, что управление передано ей; кроме деления 
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на ноль, такими причинами могут быть нарушение защиты памяти, по- 
пытка выполнить запрещённую или несуществующую инструкцию и т. п. 

Легко заметить, что действия, которые должен выполнить процес- 
сор, оказываются очень похожи на рассмотренный ранее случай аппа- 
ратного прерывания. Основное отличие состоит в отсутствии обмена по 
шине (запроса, и подтверждения прерывания): действительно, информа- 
ция о перечисленных событиях возникает внутри процессора, а не вне 
его“. Остальные шаги по обработке деления на ноль и других подобных 
ситуаций повторяют шаги по обработке аппаратного прерывания прак- 
тически дословно. Поэтому обработку ситуаций, в которых дальнейшее 
выполнение активной задачи оказывается невозможной по причине вы- 
полненных ею некорректных действий, называют так же, как и действия 
по запросу внешних устройств — прерываниями. Чтобы не путать раз- 
ные по своей природе прерывания, их делят на внешние (аппаратные) и 
внутренние; такая терминология оправдана тем, что причина внешнего 
прерывания находится вне центрального процессора, тогда как причи- 
на внутреннего — у ПП внутри. Иногда внутренние прерывания назы- 
вают иначе, например ловушками, (traps), исключениями (exceptions) 
или как-то ещё. 


§ 4.2.3. Программные прерывания 


Как уже говорилось, пользовательской задаче не позволяется делать 
ничего, кроме преобразования данных в отведённой ей памяти. Все дей- 
ствия, затрагивающие внешний по отношению к задаче мир, выполня- 
ются через операционную систему. Соответственно, необходим механизм, 
позволяющий пользовательской задаче обратиться к ядру операционной 
системы за теми или иными услугами. Напомним, что обращение поль- 
зовательской задачи к ядру операционной системы за услугами 
называется системным вызовом. Ясно, что по своей сути систем- 
ный вызов — это передача управления от пользовательской задачи ядру 
операционной системы. Однако здесь есть две проблемы. Во-первых, яд- 
ро работает в привилегированном режиме, а пользовательская задача — 
в ограниченном. Во-вторых, пространство адресов ядра для пользовал 
тельской задачи обычно недоступно (более того, в адресном простран- 
стве задачи этих адресов может вообще не быть). Впрочем, даже если 
бы оно было доступно, позволить пользовательской задаче передавать 
управление в произвольную точку ядра было бы несколько странно. 

Итак, для осуществления системного вызова необходимо сменить ре- 
жим выполнения с пользовательского на привилегированный и передать 


4С точки зрения реализации внутренние прерывания могут оказаться многократно 
проще, чем аппаратные, за счет того, что они всегда происходят на определенной фазе 
выполнения инструкции; подробности читатель найдет в книге [1]. 
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управление в некоторую точку входа в операционной системе. Нам уже 
известны два случая, в которых происходит что-то подобное — это ап- 
паратные и внутренние прерывания. Изобретать дополнительный меха- 
низм для системного вызова не обязательно: для его реализации можно 
использовать частный случай внутреннего прерывания, инициируемый 
специально предназначенной для этого машинной инструкцией. На раз- 
ных архитектурах соответствующая инструкция может называется trap 
(ловушка), svc (supervisor call, то есть «обращение к супервизору») ит.д. 
Рассматриваемые нами процессоры семейства 1386 используют коман- 
ду int (от слова interrupt — прерывание). Такое прерывание называет- 
ся программным прерыванием. Отличие этого вида прерывания от 
остальных состоит в том, что оно происходит по инициативе пользова- 
тельской задачи, тогда как другие прерывания случаются без её ведома: 
внешние — по требованию внешних устройств, внутренние — в случае 
непредвиденных обстоятельств, которые вряд ли были выполняемой про- 
граммой предусмотрены. Некоторые авторы не делают различия между 
терминами «программное прерывание» и «системный вызов», называя 
системным вызовом как само обращение к ОС, так и программное пре- 
рывание, используемое для его осуществления. 

Некоторые процессоры могут предусматривать и иные механизмы пе- 
редачи управления операционной системе. Так, процессоры семейства 
1386 реализуют так называемые шлюзы (англ. gates) для передачи управ- 
ления привилегированным программам с одновременным повышением 
уровня привилегированности режима работы процессора, а самих этих 
уровней, называемых кольцами защиты, процессоры семейства 1386 под- 
держивают не два, а четыре; впрочем, операционные системы этим обыч- 
но не пользуются. 

Так или иначе, повышение уровня привилегий (переход из ограничен- 
ного режима в привилегированный) возможно только при условии одно- 
временной передачи управления на заранее заданную точку входа, при- 
чем адреса возможных точек входа могут настраиваться только в при- 
вилегированном режиме. Таким образом, операционная система имеет 
возможность гарантировать, что при смене режима работы на привиле- 
гированный управление получит только код самой операционной систе- 
мы, причем только такой её код, который для этого специально предна- 
значен. Исполнение в привилегированном режиме какого бы то ни было 
пользовательского кода полностью исключается. 


$ 4.3. Системные вызовы в ОС Unix 


Перейдём теперь к освоению системных вызовов на практике. Сле- 
дует отметить, что соглашения о том, как конкретно должен происхо- 
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дить системный вызов, как передать ему необходимые параметры, какое 
использовать прерывание, как получить результат выполнения и T.I., 
варьируются от системы к системе. Даже если речь идёт о двух пред- 
ставителях семейства Unix (ОС Linux и ОС FreeBSD), работающих на 
одной и той же аппаратной платформе 1386, низкоуровневая реализация 
системных вызовов оказывается в них совершенно различна. Следующие 
два параграфа будут посвяшены описанию соглашений об организации 
системных вызовов этих двух систем”; при желании вы можете прочи- 
тать только один из этих двух параграфов, относящийся к той системе, 


которую вы используете. 


Следует иметь в виду, что системы семейства Unix расчитаны в OC- 
новном на программирование на языке Си. Естественно, для этого язы- 
ка вместе с системой поставляются библиотеки, облегчающие работу 
с системными вызовами — в частности, для каждого системного вы- 
зова предоставляется библиотечная функция, позволяющая обратить- 
ся к услугам ядра как к обычной подпрограмме. Системные вызовы 
в ОС Unix имеют названия, совпадающие с именами соответствующих 
функций-обёрток из библиотеки языка Си. К сожалению, такая ориен- 
тированность на Си приводит к некоторым неудобствам при работе на 
уровне языка ассемблера. Так, системные вызовы при переходе от систе- 
мы к системе могут менять свои номера (например, getppid в ОС Linux 
имеет номер 64, ав ОС FreeBSD — номер 39). Программисты, работа- 
ющие на языке Си, об этом могут не задумываться, поскольку в любой 
системе семейства UNİX им достаточно вызвать обычную функцию с име- 
нем getppid, а конкретное исполнение системного вызова возлагается на 
библиотеку, которая прилагается к системе, так что программа, напи- 
санная программистом на Си с использованием getppid, будет успешно 
компилироваться на любой системе и работать одинаково. Иное дело, ес- 
ли мы пишем на языке ассемблера. Никакой библиотеки системных вы- 
зовов у нас при этом нет, номер вызова мы должны указать в программе 
явно, так что в тексте, предназначенном для Linux, придётся использо- 
вать число 64, тогда как для FreeBSD нужно будет число 39. Получается, 
что написанный нами исходный текст будет пригоден для одной систе- 
мы и ошибочен для другой. Аналогично обстоят дела и с некоторыми 
числовыми константами, которые вызовы получают на вход. 


Частично нас может выручить макропроцессор с его директивами 
условной компиляции, либо мы можем ограничиться только одной си- 
стемой (что, на самом деле, не совсем правильно). К счастью, системы 
FreeBSD и Linux всё же во многом похожи друг на друга и числовые 3Ha- 
чения, связанные с системными вызовами, частично совпадают (с дру- 


5 Естественно, ОС Linux рассматривается в варианте для 1386; версии этой системы, 
предназначенные для других аппаратных архитектур, устроены иначе. 
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гими системами семейства Unix было бы хуже). Так или иначе, кто Npe- 
дупреждён, тот вооружён. 


8 4.3.1. Конвенция ОС Linux 


Ядро Linux на платформе 1386 использует для осуществления систем- 
ного вызова прерывание с номером 80%. Номер системного вызова пере- 
даётся ядру через регистр ЕАХ; если системный вызов принимает пара- 
метры, то они располагаются, соответственно, в регистрах EBX, ECX, EDX, 
ESI и EDI; отметим, что все параметры системных вызовов являются Ye- 
тырёхбайтными значениями — либо целочисленными, либо адресными. 
Результат выполнения вызова возвращается через регистр EAX, причём 
значение, заключённое между ЁЁҒҒҒОООҺ и ffffffffh, свидетельствует о 
происшедшей ошибке (и представляет собой условный код этой ошибки). 

Рассмотрим для примера системный вызов Write, позволяющий про- 
извести вывод данных через один из открытых потоков ввода-вывода, в 
том числе запись в открытый файл, а также печать на стандартный вы- 
вод (в просторечии «на экран»). Этот системный вызов имеет номер 4 и 
принимает три параметра: дескриптор (номер) потока, ввода-вывода, ад- 
рес памяти, где расположены данные, подлежащие выводу, и количество 
этих данных в байтах. Отметим, что поток стандартного вывода в ОС 
Unix имеет дескриптор 1 (точнее, поток вывода под номером 1 считается 
стандартным выводом). Таким образом, если мы хотим вывести строку 
«на экран», то есть сделать то, что делает макрос РВІМТ, нам нужно бу- 
дет занести число 4 в ЕАХ, занести число 1 в ЕВХ, занести адрес строки 
в ECX и длину строки — в EDX, а затем дать команду int 801, чтобы 
инициировать программное прерывание. 

Другой важный системный вызов — это вызов _exit, используемый 
для завершения программы. Он имеет номер 1 и принимает один пара- 
метр, представляющий собой код завершения. Программы используют 
код завершения, чтобы сообщить операционной системе, успешно ли они 
справились с возложенной на них задачей: если всё прошло как ожида- 
лось, используется код 0, если же в ходе работы возникли те или иные 
ошибки, используются коды 1, 2 и т.д. 

Зная всё это, мы можем написать программу, печатающую строку и 
сразу после этого завершающуюся; файл stud_io.inc и его макросы нам 
для этого больше не нужны: 


global _ѕ+агї 
section .data 


msg db "Hello world", 10 
msg_len equ $-msg 
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section .text 


„start: mov eax, 4 ; вызов Write 
mov ebx, 1 ; стандартный вывод 
mov ecx, msg 
mov edx, msg_len 
int 80h 
mov eax, 1 ; ВЫЗОВ _exit 
mov ebx, 0 ; код "успех" 
int 80h 


§ 4.3.2. Конвенция OC FreeBSD 


Описание конвенции OC FreeBSD несколько сложнее. Эта, система, 
также использует прерывание 80h и принимает номер системного вы- 
зова через регистр ЕАХ, но все параметры вызова передаются не через 
регистры, а через стек, подобно тому, как передаются параметры в под- 
программы в соответствии с соглашениями языка Си, то есть в обратном 
порядке (см. стр. 82). Как ив ОС Linux, все параметры вызовов представ- 
ляют собой четырёхбайтные значения. Результат выполнения системно- 
го вызова возвращается через регистр ЕАХ, но при этом о происшедшей 
ошибке свидетельствует не попадание значения в специальный промежу- 
ток (как это сделано в Linux), а установленное значение флага СЕ. Если 
СЕ сброшен, то вызов завершился успешно и его результат находится в 
ЕАХ, если же флаг установлен, то произошла ошибка и в ЕАХ записан код 
этой ошибки. 

Необходимо отметить ещё одну особенность. Ядро FreeBSD предпо- 
лагает, что управление ему передано путём обращения к процедуре сле- 
дующего вида: 


Кегпе1: 
int 80% 
ret 


Если у нас есть такая процедура, нам для обращения к ядру достаточно 
поместить в стек параметры точно так же, как для обычной процедуры, 
занести номер вызова в ЕАХ и сделать са11 Кегпе1; при этом команда 
са11 занесёт в стек адрес возврата, который и будет лежать на вершине 
стека в момент выполнения программного прерывания, а параметры бу- 
дут располагаться в стеке ниже вершины. Ядро FreeBSD учитывает это и 
ничего не делает с числом на вершине стека (ведь это число — адрес воз- 
врата из процедуры Кегпе1 — никакого отношения к параметрам вызова 
не имеет), а настоящие параметры извлекает из стека ниже вершины (из 
позиций [еѕр+4], [езр+8] и т.д.) 
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При работе на языке ассемблера выделять вызов прерывания в от- 
дельную подпрограмму не обязательно, достаточно перед командой int 
занести в стек дополнительное «двойное слово», например, выполнив 
лишний раз команду push eax (или любой другой 32-битный регистр). 
Естественно, после выполнения системного вызова и возврата из него 
необходимо убрать из стека всё, что туда было занесено; делается это, 
как и при вызове обычных подпрограмм, путём увеличения регистра ЕЗР 
на нужную величину простой командой ааа. 

Описывая в предыдущем параграфе конвенцию ОС Linux, мы для 
иллюстрации использовали вызовы Write и _ехії (см. стр. 137). Анало- 
гичная программа для FreeBSD будет выглядеть следующим образом: 


global _ѕ+агї 


section .data 
msg db "Hello world", 10 
msg_len equ $-msg 


section .text 

start: 
push dword msg_len 
push dword msg 


push dword 1 ; стандартный вывод 
шоу еах, 4 ; write 

push eax ; что угодно 

int 80h 

add esp, 16 ; 4 двойных слова 
push dword 0 ; код "успех" 

шоу еах, 1 ; вызов _ех1ї 

push eax ; что угодно 

int 80h 


Мы не стали очищать стек после системного вызова _ехіё, поскольку OH 
всё равно не возвращает управление. 

В этом примере мы не обрабатываем ошибки, предполагая, что запись 
в стандартный поток ввода всегда успешна (это в общем случае не так, 
но достаточно часто программисты на это не обращают внимания). Если 
бы мы хотели обрабатывать ошибки «честно», первой же командой после 
int 80h должна была бы быть команда јс или јас, делающая условный 
переход в зависимости от состояния флага, СЕ, в противном случае мы 
рискуем, что очередная команда выставит этот флаг сообразно своим 
результатам и признак происшедшей ошибки будет потерян. В ОС Linux c 
этим было несколько проще, достаточно не трогать регистр ЕАХ, и ничего 
не потеряется. 
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§ 4.3.3. Некоторые системные вызовы Unix 


В вышеприведённых примерах мы рассмотрели системные вызовы 
_exit и write; напомним, что _exit имеет® номер 1 и принимает один 
параметр — код завершения, а вызов Write имеет номер 4 и принима- 
ет три параметра, а именно номер дескриптора потока вывода (1 для 
потока стандартного вывода), адрес области памяти, где расположены 
выводимые данные, и количество этих данных. 

Для ввода данных (как из файлов, так и из стандартного потока вво- 
да, т.е. «с клавиатуры») используется вызов геаа, имеющий номер 3. 
Его параметры аналогичны вызову Write: первый параметр — номер де- 
скриптора потока, ввода (для стандартного ввода используется дескрип- 
тор 0), второй параметр — адрес области памяти, в которой необходимо 
разместить прочитанные данные, а третий — количество байтов, кото- 
рое надлежит попытаться прочитать. Естественно, область памяти, ад- 
рес которой мы передаём вторым параметром, должна иметь размер не 
менее числа, передаваемого третьим параметром. Очень важно про- 
анализировать значение, возвращаемое вызовом геаа! (напомним, 
что это значение сразу после вызова содержится в регистре ЕАХ.) Если 
чтение прошло успешно, вызов вернёт строго положительное число — 
количество прочитанных байтов, которое, естественно, не может превы- 
шать «заказанное» через третий параметр количество, но вполне может 
оказаться меньше (например, мы потребовали прочитать 200 байтов, а 
реально было прочитано только 15). Очень важен случай, когда геаа 
возвращает число 0 — это свидетельствует о том, что в используемом 
потоке ввода возникла ситуация «конец файла». При чтении из файлов 
это значит, что весь файл прочитан и больше в нём данных нет. Однако 
«конец файла» может произойти не только при чтении из настоящего 
файла; так, при вводе с клавиатуры в ОС Unix можно сымитировать 
ситуацию «конец файла», нажав комбинацию клавиш Ctrl-D. 

Помните, что программа, в которой используется вызов геаа 
и не производится анализ его результата, заведомо не может 
быть правильной. Действительно, мы в этом случае не можем знать, 
сколько первых байтов нашей области памяти содержат реально про- 
читанные данные, а сколько оставшихся продолжают содержать произ- 
вольный «мусор» — а значит, какая-либо осмысленная работа с этими 
данными невозможна. 

При чтении, как и при использовании других системных вызовов, 
может произойти ошибка. В ОС Linux это легко обнаружить по отрица- 
тельному значению регистра EAX после возврата из вызова; в ОС FreeBSD 
для указания на то, что произошла ошибка, системные вызовы исполь- 


6Bo всяком случае, в системах Linux и FreeBSD; в дальнейшем, если нет явных 
указаний, подразумевается, что сказанное верно как минимум для этих двух систем. 
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зуют флаг СЕ (carry flag): если вызов завершился успешно, на выходе из 
него этот флаг будет сброшен, если же произошла, ошибка, то флаг будет 
установлен. Это касается и вызова read, и рассмотренного ранее вызова 
write (мы не обрабатывали ошибочные ситуации, чтобы не усложнять 
наши примеры, но это не значит, что ошибки не могут произойти), и всех 
остальных системных вызовов. 


На момент запуска программы для неё, как правило, открыты потоки 
ввода-вывода с номерами 0 (стандартный ввод), 1 (стандартный вывод) 
и 2 (поток для выдачи сообщений об ошибках), так что мы можем приме- 
нять вызов read к дескриптору 0, а к дескрипторам 1 и 2 — вызов write. 
Часто, однако, задача требует создания иных потоков ввода-вывода, на- 
пример, для чтения и записи файлов на диске. Прежде чем мы сможем 
работать с файлом, его необходимо открыть, в результате чего у нас по- 
явится ещё один поток ввода-вывода, со своим номером (дескриптором). 
Делается это с помощью системного вызова ореп, имеющего номер 5. 
Вызов принимает три параметра. Первый параметр — адрес строки тек- 
ста, задающей имя файла; имя должно заканчиваться нулевым байтом, 
который служит в качестве ограничителя. Второй параметр — число, 
задающее режим использования файла (чтение, запись и пр.); значение 
этого параметра, формируется как битовая строка, в которой каждый 
бит означает определённую особенность режима, например, доступность 
только на запись, разрешение создать новый файл, если его нет, и т.п. 
К сожалению, расположение этих битов различно для ОС Linux и ОС 
FreeBSD; некоторые из флагов вместе с их описаниями и численными 
значениями приведены в таблице 4.1. Отметим, что наиболее часто встре- 
чаются два варианта для этого параметра. Первый из них — открытие 
файла только для чтения, в обеих рассматриваемых системах этот слу- 
чай задаётся числом 0. Второй случай — открытие файла на запись, 
при котором файл создаётся, если его не было, а если он был, то его 
старое содержимое теряется (в программах на Си это задаётся комбина- 
цией 0_\ВОМТ.У | 0_СВЕАТ|0_ТВОМС). Для Linux соответствующее числовое 
значение — 241%, для FreeBSD — 601%. Третий параметр вызова open nc- 
пользуется только в случае создания файла и задаёт права доступа для 
него. Подробное описание этого параметра мы опускаем, отметим толь- 
ко, что в большинстве случаев его следует задать равным восьмеричному 
числу 06664. 


Для вызова ореп особенно важен анализ его возвращаемого значения 
и проверка, не произошла ли ошибка. Вызов ореп может завершиться с 
ошибкой в силу массы причин, большинство из которых программист 
никак не может ни предотвратить, ни предсказать: например, кто-то 
может неожиданно стереть файл, который мы собирались открыть на 
чтение, или запретить нам доступ к директории, где мы намеревались 
создать новый файл. Итак, после выполнения вызова ореп нам необхо- 
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название | описание значение для 
Linux | FreeBSD 
O_RDONLY | только чтение 0008 0008 
0_МВОМТ.У | только запись 001 001 
O_RDWR чтение и запись 0026 0021 
О_СВЕАТ | разрешить создание файла 0406 2008 
0_ЕХСТ, потребовать создание файла 0808 8008 
0_ТВОМС | если файл существует, уничтожить | 2006 400 
его содержимое 
О_АРРЕМО | если файл существует, дописывать в | 4006 0086 
конец 


Таблица 4.1. Некоторые флаги для второго параметра, вызова, ореп 


димо проверить, не содержит ли регистр ЕАХ отрицательное значение (в 
ОС Linux) или не взведён ли флаг СЕ (в ОС FreeBSD). Если вызов 3a- 
кончился успешно, то регистр ЕАХ содержит дескриптор открытого 
файла, (потока ввода или вывода). Именно этот дескриптор теперь сле- 
дует использовать в качестве первого параметра в вызовах read и write 
для работы с файлом. Как правило, это значение следует сразу же после 
вызова скопировать в специально отведённую для него область памяти. 

Когда все действия с файлом завершены, его следует закрыть. Это 
делается с помощью вызова close, имеющего номер 6. Вызов принимает 
один параметр, равный дескриптору закрываемого файла. После это- 
го поток ввода-вывода с таким дескриптором перестаёт существовать; 
последующие вызовы ореп могут снова использовать тот же номер де- 
скриптора. 

Задача в ОС Unix может узнать свой номер (так называемый иден- 
тификатор процесса) с помощью вызова getpid, а также номер своего 
непосредственного «предка» (процесса, создавшего данный процесс) с 
помощью вызова getppid. Вызов getpid в обеих рассматриваемых CH- 
стемах имеет номер 20, тогда как вызов getppid имеет номер 64 в ОС 
Linux и номер 39 в ОС FreeBSD. Оба вызова не принимают параметров; 
запрашиваемый номер возвращается в качестве результата работы вызо- 
ва через регистр ЕАХ. Отметим, что эти два вызова всегда завершаются 
успешно, ошибкам тут просто неоткуда взяться. 

Системный вызов kill (номер 37) позволяет отправить сигнал про- 
цессу с заданным номером. Вызов принимает два параметра, первый за- 
даёт номер процесса”, второй задаёт номер сигнала; в частности, сигнал 
№15 (ЗТСТЕВМ) предписывает процессу завершиться (но процесс может 


THa самом деле можно отправить сигнал сразу группе процессов или даже всем 
процессам в системе, но подробное описание этого выходит за рамки нашего курса. 
bi 
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этот сигнал перехватить и завершиться не сразу, либо вообще не завер- 
шаться), а сигнал №9 (SIGKILL) уничтожает процесс, причём этот сигнал 
нельзя ни перехватить, ни игнорировать. 

Ядра операционных систем семейства Unix поддерживают сотни раз- 
нообразных системных вызовов; заинтересованные читатели могут най- 
ти информацию об этих вызовах в сети Интернет или в специальной 
литературе. Отметим, что для ознакомления с информацией о систем- 
ных вызовах желательно знать язык программирования Си, да и работа 
на уровне системных вызовов с помощью языка Си строится гораздо 
проще. Более того, некоторые системные вызовы в отдельных системах 
могут не поддерживаться ядром, а вместо этого эмулироваться библио- 
течными функциями Си, что делает их использование в программах на 
языке ассемблера практически невозможным. В этой связи нелишним 
будет напомнить, что язык ассемблера мы рассматриваем с учебной, а 
не практической целью. Программы, предназначенные для практическо- 
го применения, лучше писать на Си или на других подходящих языках 
высокого уровня. 


$4.4. Параметры командной строки 


При работе в операционной среде ОС Unix мы, как правило, запус- 
каем программы, указывая кроме их имён ещё и определённые парамет- 
ры — имена файлов, опции и т. п. Так, при запуске ассемблера МАЅМ мы 
можем написать что-то вроде 


nasm -f elf prog.asm 


Слова, указанные после имени программы, называются NAPAMEMPAMU 
командной строки. В данном случае этих аргументов три: ключ «-?», 
слово «е1#», обозначающее нужный нам формат результата трансляции, 
и имя файла «ргор.азш». Отметим, что и само имя программы, в данном 
случае «пазш», считается элементом командной строки. Иначе говоря, 
командная строка, представляет собой массив строк, состоящий в данном 
случае из четырёх элементов: «пазш», «-Ё», «е1#» и «ргор.азш». 
Естественно, мы и сами можем написать программу, получающую те 
или иные сведения через командную строку. При запуске программы опе- 
рационная система отводит в её адресном пространстве специальную об- 
ласть памяти, в которой располагает строки, составляющие командную 
строку. Информация об адресах этих строк вместе с их общим количе- 
ством для удобства помещается в стек запускаемой задачи, после чего 
управление передаётся нашей программе. Таким образом, в тот момент, 
когда наша программа начинает выполняться с метки _start, на Bep- 
шине стека (то есть по адресу [еѕр1) располагается четырёхбайтное це- 
лое число, равное количеству элементов командной строки (включая имя 
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программы), в следующей позиции стека (по адресу [еѕр+4]) распола- 
гается адрес в памяти, где находится имя, по которому нашу программу 
вызвали, далее (по адресу [еѕр+8]) находится адрес первого параметра, 
потом второго параметра и т.д. Каждый элемент командной строки хра- 
нится в памяти в виде строки (массива, символов), ограниченной справа 
нулевым байтом. 

Для примера рассмотрим программу, печатающую параметры сво- 
ей командной строки (включая нулевой). Пользоваться средствами 
stud_io.inc мы уже не станем, поскольку знаем, как без них обойтись. 
Для использования вызова Write нам понадобится знать длину каж- 
дой печатаемой строки, поэтому для удобства мы опишем подпрограмму 
strlen, получающую в качестве параметра через стек адрес строки и воз- 
врашающую через регистр ЕАХ длину этой строки (предполагается, что 
конец строки обозначен нулевым байтом). Кроме того, отдельную под- 
программу (newline) опишем для печати символа перевода строки; при 
этом нам потребуется область памяти из одного байта, равного 10, то есть 
коду перевода строки, чтобы передавать её адрес вызову Write, и мы эту 
область памяти отведём прямо в секции .ехб вместе с кодом подпро- 
граммы newline сразу после команды ret, пометив локальной меткой. 

Ещё один своеобразный момент состоит в том, что наша, програм- 
ма будет расчитана как для работы с ОС Linux, так и для работы с 
ОС FreeBSD. Поскольку системные вызовы в этих ОС выполняются NO- 
разному, мы воспользуемся директивами условной компиляции для вы- 
бора того или иного текста. Эти директивы будут предполагать, что при 
компиляции под ОС Linux мы определяем (в командной строке NASM) 
макросимвол 0$_Т.ТМОХ, а при работе под FreeBSD — символ OS_FREEBSD. 
Таким образом, при работе под ОС Linux наш пример (назовём его 
сша1.авш) нужно будет компилировать с помощью команды 


nasm -f elf -а905_ГТМОХ ста1.аѕт 
а при работе под OC FreeBSD — командой 
nasm -f elf -а0$_ЕВЕЕВЗО сша1.азт 
Итак, пишем текст: 


section .text 
global _start 


strlen: ; агрі == address of the string 
push ebp 
mov ebp, esp 


8Мы можем так поступить, поскольку эту область памяти наша программа не 
меняет; если бы это было не так, пришлось бы располагать её в секции .data. 
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push esi 

xor eax, eax 

mov esi, [ebp+8] ; arg1 
.1р: cmp byte [esi], 0 

jz .quit 

inc esi 

inc eax 

jmp short .lp 
.quit: pop esi 

pop ebp 

ret 


newline: 
pushad 
%ifdef 05_ЕВЕЕВ5р 
push dword 1 
push dword .nwl 
push dword 1 ; stdout 
mov eax, 4 ; write 
push eax 
int 80h 
add esp, 16 
%elifdef 0S_LINUX 
mov edx, 1 
mov ecx, .nwl 
mov ebx, 1 
mov eax, 4 
int 80h 
helse 
error please define either OS_FREEBSD ог 0$_ТТМОХ 
Хепаіғ 
рораа 
геї 
.nwl db 10 


start: 
mov ecx, [esp] 
mov esi, esp 
add esi, 4 
again: push dword [esi] 
call strlen 
add esp, 4 
push esi 
push ecx 
%ifdef 0S_FREEBSD 
push eax 
push dword [esi] 
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push амога 1 ; stdout 
mov eax, 4 ; write 


push eax 

int 80h 

add esp, 16 
else 

mov edx, eax 

mov ecx, [esi] 

mov ebx, 1 

mov eax, 4 

int 80h 
Хепаіғ 

call newline 

pop ecx 

pop esi 

add esi, 4 


loop again 


ifdef 0S_FREEBSD 
push dword 0 


mov eax, 1 ; _exit 
push eax 
int 80h 
else 
mov ebx, 0 
mov eax, 1 
int 80h 
Хепаіғ 


5 4.5. Пример: копирование файла 


Рассмотрим ещё один пример программы, активно взаимодействую- 
щей с операционной системой. Эта программа будет получать через па- 
раметры командной строки имена двух файлов — оригинала и копии 
и создавать копию под заданным именем с заданного оригинала. Наша 
программа будет работать достаточно просто: проверив, что ей действи- 
тельно передано два параметра, она попытается открыть первый файл 
на чтение, второй файл — на запись и, если ей это удалось, то цикли- 
чески читать из первого файла данные порциями по 4096 байт, пока не 
возникнет ситуация «конец файла». Сразу после чтения каждой порции 
программа будет записывать прочитанное во второй файл. Настоящая 
команда ср, предназначенная для копирования файлов, устроена гораздо 
сложнее, но для нашего учебного примера лишняя сложность не нужна. 

Ясно, что нашей программе предстоит активно пользоваться систем- 
ными вызовами. Дело осложняется тем, что нам хотелось бы, конечно, 
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написать программу, которая будет успешно компилироваться и работать 
как под ОС Linux, так и под ОС FreeBSD. Как мы видели на примере npo- 
граммы из предыдущего параграфа, это требует довольно громоздкого 
оформления каждого системного вызова директивами условной компи- 
ляции. Предыдущий пример, содержащий всего три системных вызова, 
можно было написать, не особенно задумываясь над этой проблемой, что 
мы и сделали; иное дело — программа, в которой предполагается больше 
десятка обращений к операционной системе. Чтобы не допустить загро- 
мождения нашего исходного кода, однообразными, но при этом объёмны- 
ми (и, значит, отвлекающими внимание) конструкциями, мы напишем 
один многострочный макрос, который и будет осуществлять системный 
вызов (точнее, он будет генерировать ассемблерный код для осуществ- 
ления системного вызова). В тексте этого макроса и будут заключены 
все различия в организации системных вызовов для Linux и FreeBSD. 
Макрос будет принимать на вход произвольное количество параметров, 
не меньшее одного; первый параметр будет задавать номер системного 
вызова, остальные — значения параметров системного вызова. Отметим, 
что для ОС Linux наш макрос откажется работать с более чем пятью 
параметрами, поскольку они уже не уместятся в регистры; для FreeBSD 
такого ограничения нет. 

При передаче параметров в макрос и раскладывании их по соответ- 
ствующим регистрам (в варианте для Linux) мы применим приём, KO- 
торый уже встречали (см. комментарий на стр. 118) — занесение всех 
параметров в стек с последующим их извлечением в нужные регистры. 
В варианте для FreeBSD никакого раскладывания по регистрам нам не 
требуется, зато требуется занести параметры в стек уже для использова- 
ния их самим системным вызовом. Таким образом, в обоих случаях тело 
макроса можно начать с занесения в стек всех его параметров (в обрат- 
ном порядке, чтобы не пришлось их как-либо переупорядочивать в ва- 
рианте для FreeBSD). Для этого мы воспользуемся директивой rotate 
точно так же, как мы это уже делали при написании макроса рса11 
(см. стр. 120). 

После этого в варианте для FreeBSD достаточно занести номер вызо- 
ва в EAX, и можно инициировать прерывание; в варианте для Linux всё 
не так просто, нужно ещё извлечь из стека, параметры и расположить 
их в регистрах, причём для различного количества параметров будут 
задействоваться различные наборы регистров; чтобы корректно обрабо- 
тать всё это, нам придётся написать целый ряд вложенных друг в друга 
директив условной компиляции, срабатывающих в зависимости от коли- 
чества, переданных макросу параметров. 

После возврата из системного вызова наши действия также разли- 
чаются в зависимости от используемой операционной системы. В случае 
ОС Linux результат вызова находится в регистре EAX, отрицательное 3Ha- 
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чение указывает на возникшую ошибку, в стеке ничего лишнего нет. В 
случае ОС FreeBSD на ошибку указывает взведённый флаг СЕ, в pern- 
стре ЕАХ может находиться как результат, так и код ошибки, а в стеке 
всё ещё лежат параметры вызова, так что стек нуждается в очистке. Мы 
поступим следующим образом: в случае ОС Linux оставим всё как есть, 
в случае же ОС FreeBSD проверим флаг СЕ, и если он взведён, изменим 
знак регистра EAX на противоположный с помощью команды neg. Таким 
образом, на выходе мы, как и для ОС Linux, будем иметь в EAX неотри- 
цательное значение в случае успеха и отрицательное — в случае ошибки; 
после этого мы совершенно спокойно можем испортить содержимое ре- 
гистра флагов, что, кстати, и произойдёт на следующей команде — мы 
очистим стек от ненужных уже параметров обычной командой ааа, ко- 
торая, как известно, выставляет флаги (включая СЕ) уже в соответствии 
со своим результатом. 
Окончательно наш макрос будет выглядеть так: 


macro syscall 1-* 
Arep %0 
%rotate -1 

push dword %1 
Хепагер 


ifdef 0$_ЕВЕЕВЗО 
шоу еах, [евр] 
int 80h 
jnc //5с_оҜк 
neg eax 
Ahsc_ok: 
add esp, (%0-1)*4 
%elifdef 0S_LINUX 
pop eax 
Aif %0 > 1 
pop ebx 
Aif %0 > 2 
pop ecx 
hif %0 > З 
pop edx 
hif %0 > 4 
pop esi 
Aif 10 > 5 
pop edi 
hif %0 > 6 
error "Тоо many params for Linux syscall" 
endif 
endif 
endif 
endif 
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ДепалЕ 
Жепаз? 
int 80h 
helse 
%error Please define either OS_LINUX ог 0S_FREEBSD 
Хепаіғ 
/епатасго 


Текст макроса, конечно, получился достаточно длинным, но это компенсиру- 
ется сокращением объёма основного кода. Так, рассказывая о конвенциях систем- 
ных вызовов, мы привели код программы, печатающей одну строку, в варианте 
для Linux (стр. 137) и FreeBSD (стр. 139). С использованием вышеприведённого 
макроса мы можем написать так: 


section .data 

msg db "Hello world", 10 

msg_len equ $-msg 

section .text 

global _start 

-start: syscall 4, 1, msg, msg_len 
syscall 1, 0 


и всё, причём эта программа будет компилироваться и правильно работать 
под обеими системами, нужно только не забывать указывать МАЗМ”у флаг 
-d0S_LINUX или -а05_ЕКЕЕВЅР. 

Вернёмся к нашей задаче копирования. В программе нам потребует- 
ся буфер для временного хранения данных, в который мы будем счи- 
тывать очередную порцию данных из первого файла, чтобы затем запи- 
сать её во второй файл. Кроме того, нам будут нужны переменные для 
хранения дескрипторов файлов (хранить их в регистрах будет сложно, 
ведь каждый системный вызов может испортить значения регистров); 
соответствующие переменные мы назовём ?авгс и fddest. Наконец, мы 
для удобства заведём переменные для хранения количества, параметров 
командной строки и адреса начала массива указателей на параметры 
командной строки, назвав эти переменные argc и агур. Все эти nepe- 
менные не требуют начальных значений и могут, таким образом, быть 
расположены в секции „.Ъзв: 


section .bss 
buffer resb 4096 


bufsize equ $-buffer 
fdsrc геѕа 1 
fddest геза 1 
argc resd 1 
argvp геѕа 1 


Наша программа может обнаружить одну из трёх ошибок: пользователь 
может указать неправильное количество параметров командной строки, 
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может указать несуществующий или недоступный файл в качестве ис- 
точника данных, либо может указать в качестве целевого такой файл, 
который мы по каким-то причинам не сможем открыть на запись. В 
первом случае пользователю следует объяснить, с какими параметрами 
следует запускать нашу программу, в остальных двух — просто сообщить 
о происшедшей ошибке. Все три сообщения об ошибках мы расположим 
в секции .data в виде инициализированных переменных: 


section .data 

helpmsg db ’Usage: copy <src> <dest>?’, 10 

helplen equ $-helpmsg 

errimsg db "Couldn’t open source file for reading", 10 
errilen equ $-errimsg 

err2msg db "Couldn’t open destination file for writing", 10 
err2len equ $-errimsg 


Теперь мы можем приступить к написанию секции .text, то есть самой 
программы, и в самом начале мы проверим, что нам передано ровно два 
параметра. Для этого мы извлечём из стека лежащее на его вершине 
число, обозначающее количество элементов командной строки, занесём 
его в переменную агрс. Заодно на всякий случай сохраним адрес теку- 
щей вершины стека в переменной агрур, но извлекать из стека больше 
ничего не будем, так что в области стека у нас окажется массив адресов 
строк-элементов командной строки. Проверим, что в переменной argc 
оказалось число 3; правильная командная строка должна в нашем случае 
состоять из трёх элементов: имени самой программы и двух параметров. 
В случае, если количество параметров окажется неверным, напечатаем 
пользователю сообщение об ошибке и выйдем: 


section .text 
global _start 
start: 
pop dword [argc] 
mov [argvp], esp 
cmp dword [argc], 3 
је .args_count_ok 
syscall 4, 2, helpmsg, helplen 
syscall 1, 1 
.args_count_ok: 


Следующим нашим действием должно стать открытие файла, имя KO- 
торого задано первым параметром командной строки, на чтение. Мы 
помним, что в переменной argvp находится адрес в памяти (стековой), 
начиная с которого располагаются адреса элементов командной строки. 
Извлечём адрес из агрур в регистр ESI, затем возьмём четырёхбайтное 
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значение по адресу [ез1+4] — это и будет адрес первого параметра ко- 
мандной строки, то есть строки, задающей имя файла, который надо чи- 
тать и копировать. Для хранения адреса воспользуемся регистром ЕРТ, 
после чего сделаем вызов open. Нам придётся использовать два парамет- 
ра — собственно адрес имени файла и режим его использования, который 
будет в данном случае равен O (O_RDONLY). Результат работы системно- 
го вызова нам обязательно надо будет проверить; напомним, что наш 
макрос зузса11 устроен так, чтобы отрицательное значение ЕАХ указы- 
вало на ошибку, а неотрицательное — на успешное выполнение вызова; в 
применении к вызову ореп результатом успешного его выполнения явля- 
ется дескриптор нового потока ввода-вывода, в данном случае это поток 
ввода, связанный с копируемым файлом. В случае успеха сохраним по- 
лученный дескриптор в переменной #аѕгс, в случае неудачи — выдадим 
сообщение об ошибке и выйдем. 


mov esi, [argvp] 
mov edi, [esi+4] 
syscall 5, edi, O ; O_RDONLY 
cmp eax, 0 
jge .source_open_ok 
syscall 4, 2, erríimsg, errilen 
syscall 1, 2 
.source_open_ok: 
mov [fdsrc], eax 


Настало время открыть второй файл на запись. Для извлечения его име- 
ни из памяти воспользуемся точно так же регистрами ESI и ЕРТ, после 
чего выполним системный вызов Open, в случае ошибки выдадим сообще- 
ние и выйдем, в случае успеха сохраним дескриптор в переменной fddest. 
Вызов ореп в этот раз будет несколько сложнее. Во-первых, режим от- 
крытия на этот раз задаётся флажками 0_МВОМТУ, О_СВЕАТ и 0_ТВОМС, 
два из которых, как это обсуждалось на стр. 141, имеют различные чис- 
ловые значения в ОС Linux и ОС FreeBSD. Во-вторых, поскольку в этот 
раз возможно создание нового файла, наш системный вызов должен по- 
лучить ещё и третий параметр, который, как мы ранее отмечали, обычно 
равен 666о. С учётом всего этого получится такой код: 


шоу еѕі, [агрур] 

mov edi, [еѕі+8] 
ifdef 0S_LINUX 

syscall 5, edi, 24ih, 06660 
Jelse ; assume it’s FreeBSD 

syscall 5, edi, 60ih, 06660 
Хепаіғ 

сшр еах, 0 
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]5е .dest_open_ok 
syscall 4, 2, егг2изр, егг21еп 
зузса11 1, 3 
.аӢеѕї _ореп_ок: 
mov [fddest], eax 


Наконец, напишем основной цикл. В нём мы будем выполнять чтение 
из первого файла, анализировать его результат, и если достигнут конец 
файла (в ЕАХ значение 0) или произошла ошибка (отрицательное значе- 
ние), то будем выходить из цикла, ну а если чтение прошло успешно, то 
нужно будет записать всё прочитанное (то есть столько байтов из обла- 
сти память buffer, какое число содержится в EAX) во второй файл. 


.араіп: syscall 3, [fdsrc], buffer, bufsize 
cmp eax, 0 
jle .end_of_file 
syscall 4, [fddest], buffer, eax 
jmp .ара1п 


Выход из цикла мы производили переходом на метку end_of_file; рано 
или поздно наша программа, достигнув конца первого файла, перейдёт 
на эту метку, после чего нам останется только закрыть оба файла вызо- 
вом с1оѕе и завершить программу: 


.end_of_file: 
syscall 6, [fdsrc] 
syscall 6, [fddest] 
syscall 1, 0 


Отметим, что все метки в основной программе, кроме метки _start, мы 
сделали локальными (их имена начинаются с точки). Так делать не обя- 
зательно, но такой подход к меткам (все метки, к которым не предпола- 
гается обращаться откуда-то издалека, делать локальными) позволяет в 
более крупных программах избежать проблем с конфликтами имён. 
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Глава 5. Раздельная 
трансляция 


$ 5.1. Что такое модули и зачем они нужны 


До сих пор все программы, которые мы писали на языке ассемблера, 
умещались в одном файле. Иногда мы использовали несколько файлов, 
но соединение их воедино производилось на этапе макропроцессирова- 
ния, то есть ещё до начала перевода программы в машинный код. 

Пока исходный текст программы состоит из нескольких десятков 
строк, его действительно удобнее всего хранить в одном файле. С увели- 
чением объема программы, однако, работать с одним файлом становит- 
ся всё труднее и труднее, и тому можно назвать несколько причин. Во- 
первых, длинный файл элементарно тяжело перелистывать. Во-вторых, 
как правило, программист в каждый момент времени работает только с 
небольшим фрагментом исходного кода, старательно выкидывая из го- 
ловы остальные части программы, чтобы не отвлекаться, и в этом плане 
было бы лучше, чтобы фрагменты, не находящиеся в работе в настоя- 
щий момент, располагались бы где-нибудь подальше, то есть так, чтобы 
не попадаться на глаза, программисту даже случайно. В-третьих, если 
программа разбита на отдельные файлы, в ней оказывается гораздо про- 
ще найти нужное место, подобно тому, как проще найти нужную бумагу 
в шкафу с офисными папками, нежели в большом ящике безо всяких 
папок. Наконец, часто бывает так, что один и тот же фрагмент кода 
используется в разных программах — а ведь его, скорее всего, так или 
иначе приходится время от времени редактировать, чтобы, например, 
исправить ошибки, и тут уже совершенно очевидно, что гораздо про- 
ше исправить файл в одном месте и скопировать (файл целиком) во все 
остальные проекты, чем исправлять один и тот же фрагмент, который 
вставлен в разные файлы. 

Разбивка текста программы на файлы, соединяемые директивами 
УлисТаае или их аналогами, снимает часть проблем, но, к сожалению, 
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не все, поскольку такой набор файлов остаётся, как говорят программи- 
сты, одной единицей трансляции — иначе говоря, мы можем их транс- 
лировать с помощью ассемблера (или с помощью компилятора, если мы 
пишем на языке высокого уровня) только все вместе, за один приём. 
Прежде всего тут возникает проблема со скоростью трансляции. Совре- 
менные компиляторы и ассемблеры работают довольно быстро, но объе- 
мы наиболее серьёзных программ таковы, что их полная перекомпиляция 
может занять несколько часов, а иногда и несколько суток. Если после 
внесения любого, даже самого незначительного изменения в программу 
нам, чтобы посмотреть, что получилось, придётся ждать сутки (да и na- 
ру часов — этого уже будет достаточно) — работать станет совершенно 
невозможно. Более того, программисты практически всегда, используют 
так называемые библиотеки — комплекты готовых подпрограмм, кото- 
рые почти никогда не изменяются и, соответственно, постоянно тратить 
время на их перекомпиляцию было бы несколько глупо. Наконец, про- 
блемы создают и постоянно возникающие конфликты имён: чем больше 
объём кода, тем больше в нём требуется меток и других идентифика- 
торов, растёт вероятность случайных совпадений, а сделать с этим при 
трансляции в один приём почти ничего нельзя — ведь даже локальные 
метки, как мы уже говорили, на самом деле представляют собой не более 
чем укороченную запись более длинных глобальных меток. 


Все эти проблемы позволяет решить техника раздельной комтиля- 
ции. Суть её в том, что программа создаётся в виде множества, обособ- 
ленных частей, каждая из которых транслируется отдельно. Такие части 
называются единицами трансляции или модулями. Чаще всего в 
роли модулей выступают отдельные файлы. Обычно в виде обособлен- 
ной единицы трансляции оформляют набор логически связанных между 
собой подпрограмм; в модуль также помещают и всё необходимое для 
их работы — например, глобальные переменные, если такие есть, а так- 
же всевозможные константы и прочее. Каждый модуль транслируется 
отдельно; в результате трансляции каждого из них получается обзект- 
ный файл, обычно имеющий суффикс < .о». Затем с помощью редактора 
связей из набора объектных файлов получают исполняемый файл. 


Очень важным свойством модуля является наличие у него собствен- 
ного пространства имён. Метки, введённые в модуле, будут видны 
только из других мест того же модуля, если только мы специально не 
объявим их «глобальными» (напомним, что в языке ассемблера МАЗМ 
это делается директивой global). Часто бывает так, что модуль вводит 
несколько десятков, а иногда и сотен меток, но все они оказываются 
нужны только в нём самом, а из всей остальной программы требуются 
обращения лишь к одной-двум процедурам. Это практически снимает 
проблему конфликтов имён: в разных модулях могут появляться метки 
с одинаковыми именами, и это никак нам не мешает, если только они не 
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глобальные. Технически это означает, что при трансляции исходного тек- 
ста модуля в объектный код все метки, кроме объявленных глобальными, 
исчезают, так что в объектном файле содержится уже только информа- 
ция об именах глобальных меток. 

Интересно, что собственные пространства имён модулей позволяют решить не 
только проблему конфликта имён, но и проблему простейшей «защиты от дура- 
ка», особенно актуальной в крупных программных разработках, в которых прини- 
мает участие несколько человек. Если автор модуля не предполагает, что та или 
иная процедура будет вызываться из других модулей, либо что переменная не 
должна изменяться никак иначе, чем процедурами того же модуля, то ему доста- 
точно не объявлять соответствующие метки глобальными, и можно ни о чём не 
беспокоиться о обратиться к ним другие программисты не смогут чисто техниче- 
ски. Такое сокрытие деталей реализации той или иной подсистемы в программе 
называется инкапсуляцией и позволяет, например, более смело исправлять код 
модулей, не боясь, что другие модули при этом перестанут работать: достаточно 
сохранять неизменными и работающими глобальные метки. 


$5.2. Поддержка модулей в NASM 


Ассемблер МАЅМ поддерживает модульное программирование, вво- 
дя для этого два основных понятия: глобальные метки и внешние 
метки. С первыми из них мы уже знакомы: такие метки объявляются 
директивой global и, как мы уже знаем, отличаются от обычных тем, 
что информация о них включается в объектный файл модуля и стано- 
вится, таким образом, видна системному редактору связей. Что касается 
внешних меток, то это, напротив, метки, введения которых мы ожи- 
даем от других модулей. Чаще всего это просто имя подпрограммы 
(реже — глобальной переменной), которая описана где-то в другом мо- 
дуле, но к которой нам необходимо обратиться. Чтобы это стало воз- 
можным, необходимо сообщить ассемблеру о существовании этой метки. 
Действительно, ассемблер во время трансляции видит только текст од- 
ного модуля и ничего не знает о том, что в других модулях объявлены 
те или иные метки, так что, если мы попытаемся обратиться к метке из 
другого модуля, никак не сообщив ассемблеру о факте её существования, 
мы попросту получим сообщение об ошибке. Для этого ассемблер МАЅМ 
вводит директиву extern. Например, если мы пишем модуль, в котором 
хотим обратиться к процедуре тургос, а сама эта процедура описана где- 
то в другом месте, то, чтобы сообщить об этом, следует написать: 


extern шургос 


Такая строка приказывает ассемблеру буквально следующее: «метка 
шургос существует, хотя её и нет в текущем модуле, так что, встретив 
такую метку, просто сгенерируй соответствующий объектный код, а кон- 
кретный адрес вместо этой метки потом подставит редактор связей». 
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$5.3. Пример 


В качестве примера многомодульной программы мы напишем про- 
стую программу, которая спрашивает у пользователя его имя, а затем 
здоровается с ним по имени. Работу со строками мы на этот раз органи- 
зуем так, как это обычно делается в программах на языке Си: будем 
использовать нулевой байт в качестве признака конца строки. Голов- 
ная программа будет зависеть от двух основных подпрограмм, putstr 
и getstr, каждую из которых мы вынесем в отдельный модуль. Подпро- 
грамме putstr потребуется посчитать длину строки, чтобы напечатать 
всю строку за одно обращение к операционной системе; для такого под- 
счёта мы используем функцию strlen, уже знакомую нам по программе 
из 64.4. Её мы тоже вынесем в отдельный модуль. Наконец, организа- 
цию вызова _ехіё мы тоже вынесем в подпрограмму (назовём её quit) 
и в отдельный модуль. Все модули назовём так же, как и вынесенные в 
них подпрограммы: putstr.asm, реїѕіг.аѕт, strlen.asm и quit .asm. 

Для организации системных вызовов мы используем макрос syscall, 
который мы описали на стр.148. Его мы также вынесем в отдельный 
файл, но полноценным модулем этот файл быть не сможет. Действи- 
тельно, модуль — это единица трансляции, тогда как макрос, вообще 
говоря, не может быть ни во что оттранслирован: как мы отмечали ра- 
нее, в ходе трансляции макросы полностью исчезают и в объектном коде 
от них ничего не остаётся. Это и понятно, ведь макросы представля- 
ют собой набор указаний не для процессора, а для самого ассемблера, и 
чтобы от макроса была какая-то польза, ассемблер должен, разумеется, 
видеть определение макроса в том месте, где он встретит обращение к 
этому макросу. Поэтому файл, содержащий наш макрос зузса11, мы бу- 
дем подсоединять к другим файлам с помощью директивы include на 
стадии препроцессирования (в отличие от модулей, которые собираются 
в единое целое существенно позже — после завершения трансляции, с 
помощью редактора связей). Этот файл мы назовём ѕуѕса11.іпс; с него 
мы вполне можем начать, открыв его для редактирования и набрав в 
нём ровно такое определение макроса, какое было дано на стр. 148; ни- 
чего другого в этом файле набирать не требуется. 

Следующим мы напишем файл strlen.asm. Он будет выглядеть так: 


global strlen 


section .text 
; procedure strlen 
; [ebp+8] == address of the string 
strlen: push ebp 
mov ebp, esp 
xor eax, eax 
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шоу esi, [еър+8] 
„1р: cmp byte [esi], 0 

jz .quit 

inc esi 

inc eax 

jmp short .lp 
.quit: pop ebp 

ret 


Первая строчка файла указывает, что в этом модуле будет определена 
метка strlen и эту метку необходимо сделать видимой из других моду- 
лей. Вообще говоря, мы могли бы поставить эту директиву где угодно, 
но лучше вынести её в начало, чтобы при первом же взгляде на текст 
модуля можно было догадаться, для чего он нужен. Подробно коммен- 
тировать текст процедуры мы не будем, поскольку он нам уже знаком. 

Имея в своём распоряжении процедуру strlen, напишем модуль 
putstr.asm. Процедура putstr будет вызывать strlen для подсчёта дли- 
ны строки, а затем обращаться к системному вызову Write: 


include "ѕуѕса11.іпс" ; нужен макрос зузса11 
global putstr ; модуль описывает putstr 
extern strlen ; а сам использует strlen 
section .text 


; ргосеа1ге putstr 
; [ebp+8] = address of the string 


putstr: push ebp ; стандартное начало 
шоу ebp, esp В подпрограммы 
push анога [ebp+8] ; вызываем strlen для 
call strlen 5 подсчёта длины строки 
ааа езр, 4 ; результат теперь в ЕАХ 
syscall 4, 1, [ebp+8], eax ; вызываем write 
mov esp, ebp ; стандартное завершение 
рор ebp Н подпрограммы 
ret 


Теперь настал черёд самого сложного из модулей нашей программы — 
модуля getstr. Процедура getstr будет получать на вход адрес буфера, 
в котором следует разместить прочитанную строку, и (на всякий слу- 
чай) длину этого буфера, чтобы не допустить его переполнения, если 
пользователю придёт в голову набрать строку, которая в наш буфер не 
поместится. Для упрощения реализации мы будем считывать строку по 
одному символу; конечно, в настоящих программах так не делают, но 
напта задача, сейчас не в том, чтобы получить эффективную программу, 
так что мы вполне можем немного облегчить себе жизнь. Подпрограмма, 
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getstr будет использовать локальную переменную, которую в коммен- 
тариях мы назовём Т и которая, как и все локальные переменные, будет 
располагаться в стековом фрейме, для чего мы в начале процедуры со- 
ответствующим образом изменим указатель стека. В переменной Т будет 
содержаться текущее количество прочитанных символов, изначально 
равное нулю. Далее процедура будет в цикле читать по одному симво- 
лу с помощью системного вызова read. Чтение будет прекращено при 
наступлении одного из следующих условий: либо геаа вернёт что-либо 
отличное от 1, что в данном случае будет означать наступление ситуации 
«конец файла» или ошибку; либо код прочитанного символа будет равен 
10, то есть это окажется символ перевода строки (этот код генерирует 
клавиша Enter); либо, наконец, в буфере останется место только под 3a- 
вершающий нулевой байт, что проверяется условием I+1>buflen. После 
выхода из цикла а конец буфера записывается ограничительный нуле- 
вой байт. В случае, если причиной выхода из цикла был прочитанный 
код символа перевода строки, нулевой байт записывается на его место, 
чтобы в буфере никаких переводов строки не содержалось; это достигал 


ется уменьшением переменной Т перед выходом из цикла. 
Полностью текст модуля getstr.asm будет выглядеть так: 


include "ѕуѕса11.іпс" ; нужен макрос syscall 
global getstr ; модуль описывает getstr 


section .text 

; procedure getstr 

; [ebp+8] = address of buffer 

; [ebp+12] = length of buffer 

getstr: push ebp ; стандартное начало 


шоу еър, езр ; подпрограммы 
sub esp, 4 ; место под переменную I 
хог еах, еах ; еах:=0 
шоу [ebp-4], eax ; Г:=0 

.again: ; начало главного цикла 
шоу eax, [ebp+8] ; заносим адрес B EAX 
add eax, [ebp-4] ; прибавляем к Hemy I 


syscall 3, 0, eax, 1 ; вызываем read 


cmp eax, 1 вернул ли он 17 

jne .ео1 нет - выйти из цикла 
шоу eax, [ebp+8] заносим адрес B EAX 
add eax, [ebp-4] прибавляем к Hemy I 
mov bl, [eax] считанный байт (в BL) 
cmp bl, 10 pasem 10? 

jne .noeol HeT - перепрыгиваем 
dec dword [еър-4] да - уменьшаем I 


јшр 
.поео1: тот 


.ео1 
eax, [ерр-4] 


и выходим из цикла 
загружаем І 
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їпс 
сшр 
јае 
inc 
jmp 
.eol: mov 
add 
inc 
хог 
mov 
mov 
pop 
ret 


eax 
eax, [ebp+12] 
.eol 

dword [ebp-4] 


.again 

eax, [ebp+8] 
eax, [еЪр-4] 
eax 

bl, bl 
[eax], bl 
esp, ebp 
ebp 


теперь B EAX зн. I+1 
не превышает ли arg2? 
да - выходим из цикла 
увеличиваем Т 
продолжаем цикл 
загружаем адрес в ЕАХ 
прибавляем Т 
прибавляем 1 
обнуляем ВІ 
заносим 0 в конец строки 
стандартный выход 

из подпрограммы 


Напишем теперь самый простой из наших модулей — quit .ази: 


include "ѕуѕса11.іпс" 


global quit 


section .text 


quit: syscall 1, 0 


Все подпрограммы готовы, и мы можем приступать к написанию TO- 
ловного модуля, который мы назовём greet .азш. Поскольку все обраше- 
ния к системным вызовам мы вынесли в подпрограммы, в головном мо- 
дуле макрос syscall (а, значит, и включение файла зузса11.1пс) нам не 
понадобится. Текст выдаваемых программой сообщений мы опишем, как 
обычно, в виде инициализированных строк в секции .даёа; надо только 
не забывать, что в этой программе все строки должны иметь ограни- 
чивающий их нулевой байт. Буфер для чтения строки мы разместим в 
секции .Ъзз. Что касается секции .text, то она будет состоять из сплош- 
ных вызовов подпрограмм. 


global _start 
extern putstr 
extern getstr 


extern quit 


section .data 


nmq db 
pmy db 
exc db 


section .bss 
buf resb 


buflen equ 


> 


$ 


2 


это головной модуль 
он использует подпрограммы 
putstr, getstr и quit 


описываем текст сообщений 


Ні, what is your паше??, 10, 0 
°Р1еаѕеа to meet you, dear ›, 0 


212, 10, O 


512 
$-buf 


section .text 


; выделяем память под буфер 
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-start: push амога пота ; начало головной программы 


call putstr ; вызываем putstr для nmq 
add esp, 4 

push dword buflen ; вызываем getstr 

push амога buf 5 с параметрами buf и 
call getstr ; buflen 

add esp, 8 

push dword pmy ; вызываем putstr для pmy 
call putstr 

add esp, 4 

push dword buf ; вызываем putstr для 
call putstr у строки, введённой 
add esp, 4 : пользователем 

push dword exc ; вызываем putstr для exc 
call putstr 

add esp, 4 

call quit ; вызываем quit 


Итак, в нашей рабочей директории теперь находятся фай- 
лы зуѕса11.іпс, strlen.asm, putstr.asm, getstr.asm, quit.asm и 
greet.asm. Чтобы получить рабочую программу, нам понадобится 
отдельно вызвать МАЅМ для каждого из модулей (напомним, что 
зузса11 .4пс модулем не является): 


nasm -f elf -905_ГТМОХ strlen.asm 
nasm -f elf -а0$_ГТМОХ putstr.asm 
nasm -f elf -а05_ГТМОХ getstr.asm 
nasm -f elf -а05_1ІІМОХ quit.asm 

nasm -f elf -а05_ГТМОХ greet.asm 


Отметим, что флажок -490$_Т.ТМОХ необходим только для тех модулей, которые 
используют syscall.inc, так что мы могли бы при компиляции strlen.asm и 
Бгееї.аѕт его не указывать. Однако практика показывает, что проще указывать 
такие флажки всегда, нежели чем помнить, для каких модулей они нужны, а для 
каких — нет. 

Результатом работы МАЅМ станут пять файлов с суффиксом «.о», 
представляющие собой обвектные модули нашей программы. Чтобы объ- 
единить их в исполняемый файл, мы вызовем редактор связей 14: 


ld ргееї.о strlen.o реїѕїг.о putstr.o 9116.0 -o greet 


Результатом на сей раз станет исполняемый файл greet, который мы, 
как обычно, запустим на исполнение командой ./greet. 
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$5.4. Объектный код и машинный код 


Из приведённых выше примеров видно, что каждый объектный мо- 
дуль, кроме всего прочего, характеризуется списком символов (в терми- 
нах ассемблера — меток), которые он предоставляет другим модулям, 
а также списком символов, которые ему самому должны быть предо- 
ставлены другими модулями. Буквально переведя с английского языка 
названия соответствующих директив (global и extern), мы можем Ha- 
звать такие символы «глобальными» и «внешними»; чаще, однако, их 
называют «экспортируемыми» и «импортируемыми». 

Ясно, что при трансляции исходного текста ассемблер, видя обраще- 
ние к внешней метке, не может заменить эту метку конкретным адре- 
сом, поскольку этот адрес ему не известен — ведь метка определена в 
другом модуле, которого ассемблер не видит. Таким образом, всё, что 
может сделать ассемблер — это оставить под такой адрес свободное ме- 
сто в итоговом коде и записать в объектный файл информацию, которая 
позволит редактору связей расставить все такие «пропущенные» адреса, 
когда их значения уже будут известны. При ближайшем рассмотрении 
оказывается, что заменить метки конкретными адресами ассемблер не 
может не только в случае обращений к внешним меткам, но вообще ни- 
когда. Дело в том, что, коль скоро программа состоит из нескольких 
(скольки угодно) модулей, ассемблер при трансляции одного из них ни- 
как не может предугадать, каким по счёту этот модуль будет стоять в 
итоговой программе, какого размера, будут все предшествующие модули 
и, таким образом, не может знать, в какой области памяти (даже вир- 
туальной) будет располагаться тот код, который ассемблер в настоящее 
время генерирует. 

С другой стороны, известно, что редактор связей не видит исходных 
текстов модулей, да и не может их видеть, поскольку предназначен для 
связи модулей, полученных различными компиляторами из исходных 
текстов на, вполне возможно, разных языках программирования. Следо- 
вательно, вся информация, необходимая для окончательного превраще- 
ния объектного кода в исполняемый машинный, должна быть записана в 
объектный файл. Таким образом, объектный код, который получается в 
качестве результата ассемблирования, представляет собой некий «полу- 
фабрикат» машинного кода, в котором вместо абсолютных (числовых) 
адресов находится некая информация о том, как эти адреса вычислить 
и в какие места кода их следует расставить. 

Отметим, что информацию о символах, содержащихся в объектном 
файле, можно узнать с помощью программы nm. В качестве упражнения 
попробуйте применить эту программу к объектным файлам написанных 
вами модулей (либо модулей из приведённых выше примеров) и попы- 
таться проинтерпретировать результаты. 
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$ 5.5. Библиотеки 


Чаще всего программы пишутся не «с абсолютного нуля», как это в 
большинстве примеров делали мы, а используют комплекты уже гото- 
вых подпрограмм, оформленные в виде библиотек. Естественно, такие 
подпрограммы входят в состав модулей, а сами модули удобнее иметь в 
заранее откомпилированном виде, чтобы не тратить время на их ком- 
пиляцию; разумеется, полезно иметь в доступности и исходные тексты 
этих модулей, но в заранее откомпилированной форме библиотеки ис- 
пользуются чаще. Вообще говоря, различают программные библиотеки 
разных видов; например, бывают библиотеки макросов, которые, есте- 
ственно, не могут быть заранее откомпилированы и существуют только 
в виде исходных текстов. Здесь мы, однако, рассмотрим более узкое поня- 
тие, а именно то, что под термином «библиотека» понимается на, уровне 
редактора связей. 

С технической точки зрения библиотека подпрограмм — это файл, 
объединяющий в себе некоторое количество объектных модулей и, как 
правило, содержащий таблицы для ускоренного поиска имён символов в 
этих модулях. 

Необходимо отметить одно важнейшее свойство объектных файлов: 
каждый из них может быть включён в итоговую программу только це- 
ликом либо не включён вообще. Это означает, например, что если вы 
объединили в одном модуле несколько подпрограмм, а кому-то потребо- 
валась лишь одна из них, в исполняемый файл всё равно войдёт код всего 
вашего модуля (то есть всех подпрограмм). Это необходимо учитывать 
при разбиении библиотеки на модули; так, системные библиотеки, по- 
ставляемые вместе с операционными системами, компиляторами и т. I., 
обычно строятся по принципу «одна функция — один модуль». 

Для построения библиотеки из отдельных объектных модулей необхо- 
димо использовать специально предназначенные для этого программы. 
В ОС Unix соответствующая программа называется аг. Изначально её 
предназначение не ограничивалось созданием библиотек (само название 
аг означает «архиватор»), так что при вызове программы необходимо 
указать с помощью параметра командной строки, чего мы от неё доби- 
ваемся. Так, если бы мы захотели объединить в библиотеку все модули 
программы greet (кроме, разумеется, главного модуля, который не MO- 
жет быть использован в других программах), это можно было бы сделать 
следующей командой: 


ar crs libgreet.a зіг1еп.о реїзіг.о риїѕіг.о quit.o 


Результатом станет файл libgreet.a; это и есть библиотека. После это- 
го скомпоновать программу greet с помощью редактора связей можно, 
например, так: 
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ld greet.o libgreet.a 
или так: 
ld greet.o -1 greet -L 


В отличие от монолитного объектного файла, библиотека, будучи yna- 
кованной в один файл, продолжает, тем не менее, быть именно набором 
объектных модулей, из которых редактор связей выбирает только те, KO- 
торые ему нужны для удовлетворения неразрешённых ссылок. Подроб- 
нее об этом мы расскажем в следующем параграфе. 


$5.6. Алгоритм работы редактора связей 


Редактору связей в командной строке указывается список объектов, 
каждый из которых может быть либо объектным файлом, либо библио- 
текой, при этом объектные файлы могут быть заданы только по имени 
файла, тогда как библиотеки могут задаваться двумя способами: либо 
явным указанием имени файла, либо — с помощью флага -1 — указани- 
ем имени библиотеки, которое может упрощённо пониматься как имя 
файла библиотеки, от которого отброшены префикс lib и суффикс .а!. 
Так, в примере из предыдущего параграфа, файл библиотеки назывался 
libgreet .а, а соответствующее имя библиотеки представляло собой сло- 
во greet. При использовании флага -1 редактор связей пытается найти 
файл библиотеки с соответствующим именем в системных директориях 
(/11Ъ, /usr/lib и т. п.), но можно указать ему дополнительные дирек- 
тории с помощью флага, -1; так, «-Г. .» означает, что следует сначала 
попробовать найти библиотеку в текущей директории, и лишь затем на- 
чинать поиск в системных директориях. 

В своей работе редактор связей использует два, списка символов: спи- 
сок известных (разрешённых, от английского resolved) символов и список 
неразрешённых ссылок (unresolved links). В первый список заносятся CHM- 
волы, экспортируемые объектными модулями (в своих текстах на язы- 
ке ассемблера NASM мы помечали такие символы директивой global), 
во второй список заносятся символы, к которым уже есть обращения, 
то есть имеются модули, импортирующие эти символы (для МАЗМ это 
символы, объявленные директивой extern и затем использованные), но 
которые пока не встретились ни в одном из модулей в качестве экспор- 
тируемых. 

Редактор связей начинает работу, инициализировав оба списка сим- 
волов как пустые, и шаг за шагом продвигается слева направо по списку 


1Мы здесь не рассматриваем случай так называемых разделяемых библиотек, фай- 
лы которых имеют суффикс .зо; концепция динамической загрузки требует допол- 
нительного обсуждения, которое выходит за рамки данного пособия. 
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объектов, указанных в его командной строке. В случае, если очередным 
указанным объектом будет объектный файл, редактор связей «прини- 
мает» его в формируемый исполняемый файл. При этом все символы, 
экспортируемые этим модулем, заносятся в список известных символов; 
если некоторые из них присутствовали в списке неразрешённых ссылок, 
они оттуда удаляются. Символы, импортируемые модулем, заносятся в 
список неразрешённых ссылок, если только они к этому времени не фи- 
гурируют в списке известных символов. Объектный код из модуля при- 
нимается редактором связей к последующему преобразованию в испол- 
няемый код и вставке в исполняемый файл. 


Если же очередным объектом из списка, указанного в командной 
строке, окажется библиотека, действия редактора связей будут более 
сложными и гибкими, поскольку возможно, что принимать все составля- 
ющие библиотеку модули ни к чему. Прежде всего редактор связей све- 
рится со списком неразрешённых ссылок; если этот список пуст, библио- 
тека будет полностью проигнорирована как ненужная. Однако обычно 
список в такой ситуации не пуст (иначе программист не стал бы указы- 
вать библиотеку), и следующим действием редактора связей становятся 
поочерёдные попытки найти в библиотеке такие модули, которые экс- 
портируют один или несколько символов с именами, фигурирующими в 
текущем списке неразрешённых ссылок; если такой модуль найден, ре- 
дактор связей «принимает» его, соответствующим образом модифициру- 
ет списки символов и начинает рассмотрение библиотеки снова, и так до 
тех пор, когда ни один из оставшихся в библиотеке непринятых модулей 
не будет пригоден для разрешения ссылок. Тогда редактор связей пре- 
кращает рассмотрение библиотеки и переходит к следующему объекту из 
списка. Таким образом, из библиотеки берутся только те модули, кото- 
рые нужны, чтобы удовлетворить потребности предшествующих модулей 
в импорте символов, плюс, возможно, такие модули, в которых нуждают- 
ся уже принятые модули из той же библиотеки. Так, при сборке програм- 
мы greet из предыдущего параграфа редактор связей сначала принял 
из библиотеки libgreet.a модули getstr, putstr и quit, поскольку в 
них присутствовали символы, импортируемые ранее принятым модулем 
greet.o; затем редактор связей принял и модуль strlen, поскольку в 
нём нуждался модуль putstr. 


Редактор связей выдаёт сообщения об ошибках и отказывается про- 
должать сборку исполняемого файла в двух основных случаях. Первый 
из них возникает, когда список объектов (модулей и библиотек) исчер- 
пан, а список неразрешённых ссылок не опустел, то есть как минимум 
один из принятых модулей ссылается в качестве внешнего на символ, ко- 
торый так ни в одном из модулей и не встретился; такая ошибочная ситу- 
ация называется неопределённой ссылкой (англ. undefined reference). 
Второй случай ошибочной ситуации — это появление в очередном при- 
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нимаемом модуле экспортируемого символа, который к этому моменту 
уже значится в списке известных; иначе говоря, два или более приня- 
тых к рассмотрению модуля экспортируют один и тот же символ. Это 
называется конфликтом имён?. 

Интересно, что редактор связей никогда не возвращается на- 
зад в своём движении по списку объектов, так что если некоторый мо- 
дуль из состава библиотеки не был принят на момент, когда редактор 
до этой библиотеки добрался, то потом он не будет принят тем более, 
даже если в каком-либо из последующих модулей появится импортируе- 
мый символ, который можно было бы разрешить, приняв ещё модули из 
ранее обработанной библиотеки. Из этого факта вытекает важное след- 
ствие: объектные модули следует указывать раньше, чем библиотеки, в 
которых эти модули нуждаются. Вторым важным следствием является 
то, что библиотеки никогда не должны «перекрёстно» зависеть 
друг от друга, то есть если одна библиотека использует возможности 
второй, то вторая не должна использовать возможности первой. Если по- 
добного рода перекрёстные зависимости возникли, такие две библиотеки 
следует объединить в одну. 

Наконец, можно сделать ещё один вывод. До тех пор, пока библиоте- 
ки вообще не зависят друг от друга, мы можем не слишком волноваться 
о порядке параметров для редактора связей: достаточно сначала, указать 
в произвольном порядке все объектные файлы, составляющие нашу про- 
грамму, а затем, опять-таки в произвольном порядке, перечислить все 
нужные библиотеки. Если же зависимости между библиотеками появля- 
ются, порядок их указания становится важен, и при его несоблюдении 
программа не соберётся. Таким образом, зависимости библиотек друг 
от друга, даже не перекрёстные, порождают определённые проблемы. 
Поэтому, прежде чем полагаться при разработке одной библиотеки на 
возможности другой, следует многократно и тщательно всё обдумать. 

Знание принципов работы редактора связей пригодится вам не толь- 
ко (и не столько) в учебном программировании на языке ассемблера, но 
и в практической работе на языках программирования высокого уровня, 
в особенности на языках Си и Си++. Не принимая во внимание содер- 
жание этого параграфа, вы рискуете, с одной стороны, перегрузить свои 
исполняемые файлы ненужным (неиспользуемым) содержимым, а с дру- 
гой — спроектировать свои библиотеки так, что даже сами начнёте в них 
путаться. 


Современные редакторы связей в угоду нерадивым программистам позволяют 
не считать некоторые случаи конфликта имён ошибкой; это используется, например, 
компиляторами языка Си++. Постарайтесь, насколько возможно, не полагаться на 
подобные возможности. 
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Глава 6. Арифметика с 
плавающей точкой 


До сих пор мы рассматривали только целые числа, и лишь вскользь 
упоминали о существовании альтернативы. Между тем, при выполнении 
численных расчётов (например, в задачах, связанных с моделировани- 
ем физических явлений и процессов) целочисленная арифметика ока- 
зывается неудобна; можно, конечно, прибегнуть к методу фиксирован- 
ной точки (считать, что используемые целые числа представляют не 
единицы, а, например, десятитысячные доли единиц), но для серьёзных 
расчётов это не подходит. Альтернативой является работа с машинным 
представлением дробных чисел в виде двоичных дробей. Такое представ- 
ление обычно считается приблизительным, а в ходе работы при выполне- 
нии арифметических операций возникают ошибки округления; это неиз- 
бежная плата за представление непрерывных (по своей сути) величин 
дискретным способом. 


В ранних процессорах линейки х86 (вплоть до 80386) возможности 
работы с числами с плавающей точкой отсутствовали; их можно было 
либо эмулировать программно (работала такая эмуляция очень медлен- 
но), либо установить в компьютер дополнительную микросхему, назы- 
ваемую арифметическим сопроцессором: 8087 для 8086, 80287 для 
80287, и, наконец, 80387 для 80386. Практически все компьютеры на ос- 
нове 386-го процессора были оснащены сопроцессором; спроса на ком- 
пьютеры без такового не было, поскольку незначительное удешевление 
системы не компенсировало отвратительно медленной работы машины с 
любыми мало-мальски заметными расчётными задачами. Поэтому при 
разработке очередного процессора в линейке (4860Х) схемы сопроцессо- 
ра были включены в одну физическую микросхему с основным процес- 
сором. Тем не менее, с точки зрения выполняющейся программы ариф- 
метический сопроцессор по-прежнему (до сих пор) представляет собой 
отдельный процессор со своей системой регистров, совсем не похожих на 
регистры основного процессора, со своими флагами, которые приходится 
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копировать в основной регистр флагов специальными командами, и со 
своими своеобразными принципами функционирования. 


86.1. Формат чисел с плавающей точкой 


Число с плавающей точкой — это особый способ двоичного пред- 
ставления дробного числа, предполагающий отдельное хранение MAH- 
тиссы М (двоичной дроби из интервала 1 < М < 2) и машинного 
порядка Р — целого числа, означающего степень двойки, на которую 
следует умножить мантиссу. Отдельный бит $ выделяется под знак чис- 
ла: если он равен 1 — число считается отрицательным, иначе положитель- 
ным. Итоговое число, таким образом, вычисляется как № = (—1)°М2Р. 
Набор частных соглашений о формате чисел с плавающей точкой, извест- 
ный как стандарт ІЕЕЕ-754, в настоящее время используется практи- 
чески всеми процессорами, способными выполнять арифметику с плава- 
ющей точкой, и двоичными форматами данных, предполагающими хра- 
нение дробных чисел. 


Поскольку целая часть мантиссы всегда равна, 1, её можно не хра- 
нить!, используя имеющиеся разряды для хранения цифр дробной ya- 
сти. Для хранения машинного порядка в разное время использовались 
разные способы (знаковое целое с использованием дополнительного кода, 
отдельный бит для знака порядка и т. п.); стандарт ТЕЕЕ-754 предполагал 
ет хранение машинного порядка в виде смещённого беззнакового целого 
числа: соответствующие разряды рассматриваются как целое число без 
знака, из которого для получения машинного порядка вычитают некото- 


рую константу, называемую смещением машинного порядка. 

Стандарт ТЕЕЕ-754 устанавливает три основных типа чисел с плава- 
юшей точкой: число обычной точности, число двойной точности и число 
повышенной точности?. Число обычной точности занимает в памяти 32 
бита, из которых один используется для хранения знака числа, восемь — 
для хранения смещённого машинного порядка (величина смещения — 
127) и оставшиеся 23 — для хранения мантиссы. Число двойной точно- 
сти занимает 64 бита, причём на машинный порядок отводится 11 бит, а 
на мантиссу — 52, и смещение машинного порядка составляет 1023. Нако- 
нец, число повышенной точности занимает 80 бит, из них 15 бит отведено 
на маптинный порядок со смещением 16383, а оставшиеся 64 составляют 
мантиссу, причём в этом формате присутствует однобитовая целая часть 
мантиссы (обычно единица). 


13а исключением нескольких особых случаев, о которых речь пойдёт дальше. 
Соответствующие англоязычные термины — single precision, double precision и 
extended precision 
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Машинный порядок, состоящий из одних нулей или, наоборот, из од- 
них единиц, представляет собой признак особого случая. Порядок, состо- 
ящий из одних нулей, означает: 


® при мантиссе, состоящей из одних нулей — в зависимости от зна- 
кового бита, либо ноль, либо «отрицательный ноль» (это различие 
бывает полезно, если результат очередной операции столь мал по 
модулю, что его невозможно представить в виде числа с плаваю- 
щей точкой — тогда мы хотя бы можем сказать, каков был знак 
результата); 


® при мантиссе, содержащей хотя бы одну единицу — денормали- 
зованное число, то есть число настолько малое по модулю, что 
даже при наименьшем возможном значении машинного порядка ни 
один значащий бит не попал бы в разряды мантиссы. 


Порядок, состоящий из одних единиц, может означать следующее: 


® при мантиссе, состоящей из одних нулей — «бесконечность» (поло- 
жительную или отрицательную в зависимости от знакового бита); 


® при первом бите мантиссы, установленном в единицу (для 80- 
битных чисел — при первых двух битах мантиссы, установленных в 
единицу), а остальных битах мантиссы, установленных в ноль, зна- 
ковый бит, равный единице, означает «неопределённость», а знал 


ковый бит, равный нулю — «не-число типа ОМАМ» (quiet поё-а- 
number); иногда говорят, что неопределённость есть частный слу- 
чай QNAN; 


® при первом бите мантиссы, равном нулю (для 80-битных — при двух 
первых битах мантиссы, равных 10) и при наличии в остальной 
мантиссе единичных битов — «не-число типа МАМ»; 


® все остальные ситуации (например, мантисса из одних единиц) 
означают «неподдерживаемое число». 


$6.2. Устройство арифметического 
сопроцессора 


Арифметический сопроцессор имеет восемь 80-битовых регистров для 
хранения чисел, которые мы условно обозначим ВО, R1, ..., ВТ; регистры 
образуют своеобразный стек, то есть один из регистров Rn считается 
вершиной стека и обозначается STO, следующий за ним обозначается ST1 
и т. д., причём считается, что следом за R7 идёт RO (например, если R7 в 
настоящий момент обозначен как 574, то роль ЗТБ будет играть регистр 
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ко $Т(5) СЕ 
R1 ST(6) SR 
R2 ST) TW 
R3 ST/ST(0) а 
R4 STA) 

R5 $Т(2) 

R6 $Т(3) FIP 

R7 $Т(4) FDP 


Рис. 6.1. Регистры арифметического сопроцессора, 


ВО, 5Т6 будет в Ві и т.д.) На рис.6.1 показана ситуация, когда верши- 
ной стека объявлен регистр ВЗ; роль вершины стека может играть любой 
из регистров Rn, причём при занесении нового значения в этот стек все 
значения, которые там уже хранились, остаются на, своих местах, а ме- 
няется только номер регистра, играющего роль вершины, то есть если в 
стек, показанный на рисунке, внести новое значение, то роль вершины — 
STO — перейдёт к регистру R2, регистр ВЗ станет обозначаться 8Т1, и так 
далее. При удалении значения из стека происходит обратное действие. 
Отметим, что к этим регистрам можно обратиться только по их теку- 
щему номеру в стеке, то есть по именам STO, $Т1, ..., $Т7. Обратиться к 
ним по их постоянным номерам (RO, R1, ..., R7) нельзя, процессор не даёт 
такой возможности. 

Обозначения STO, $11, ..., ЗТ7 соответствуют соглашениям NASM. В других 
ассемблерах используются другие обозначения; в частности, МАЅМ и некоторые 
другие ассемблеры обозначают регистры арифметического сопроцессора с ис- 
пользованием круглых скобок: 5Т(0), $Т(1), ..., $Т(7), и именно такие обозначе- 
ния чаще всего встречаются в литературе. Не удивляйтесь этому. 

Регистр состояния SR (state register) содержит ряд флагов, описываю- 
щих, как следует из названия, состояние арифметического сопроцессора. 
В частности, биты 13-й, 12-й и 11-й (всего три бита) содержат число от 
0 до 7, называемое ТОР и показывающее, какой из регистров Rn в Ha- 
стоящий момент считается вершиной стека. Флаги СО (бит 8), С2 (бит 
10) и СЗ (бит 14) соответствуют по смыслу флагам центрального про- 
цессора СЕ, РЕ и ZF. Остальные разряды регистра ST указывают на такие 
особые ситуации, как переполнение или антипереоплнение стека (SF), по- 
терю точности (Р), слишком большой или слишком маленький результат 
последней операции (0 и U), деление на ноль (Z) и др. Регистр управле- 
ния СВ также состоит из отдельных флагов, но, в отличие от регистра 
статуса, эти флаги обычно устанавливаются программой и предназна- 
чены для управления сопроцессором, то есть для задания режима его 
работы. Например, биты 11 и 10 этого регистра задают режим округ- 
ления результата, операции: 00 — к ближайшему числу, 01 — в сторону 
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уменьшения, 10 — в сторону увеличения, 11 — в сторону нуля (то есть 
в сторону уменьшения абсолютной величины). Регистр тегов TW содер- 
жит по два бита для обозначения состояния каждого из регистров КО-В7: 
00 — регистр содержит число, 01 — регистр содержит ноль, 10 — в реги- 
стре не-число (МАМ, бесконечность или денормализованное число), 11 — 
регистр пуст. Исходно все восемь регистров помечены как пустые, по ме- 
ре добавления чисел в стек соответствующие регистры помечаются как 
заполненные, при извлечении чисел из стека — снова как пустые. Это 
позволяет отслеживать переполнение и антипереполнение стека, — такие 
ситуации, когда в стек заносится девятое по счёту число (которое некуда 
поместить), либо, наоборот, делается попытка извлечь число из пустого 
стека. Эти три регистра мы подробно рассмотрим в $ 6.7.3. 

Служебные регистры FIP и FDP предназначены для хранения адреса 
и операнда последней выполняемой сопроцессором машинной команды 
и используются операционной системой при анализе причин возникнове- 
ния ошибочной (исключительной) ситуации. 

Мнемонические обозначения всех машинных команд, имеющих отно- 
шение к арифметическому сопроцессору, начинаются с буквы f от aH- 
глийского floating (плавающий; словосочетание «плавающая точка» HNO- 
английски звучит как floating point). Большинство таких команд не име- 
ет операнда или имеет один операнд, но встречаются и команды с двумя 
операндами. В качестве операнда могут выступать регистры сопроцес- 
сора, обозначаемые STn, либо операнды типа «память». При этом сопро- 
цессор умеет работать с вещественными числами, хранящимися в памяти 
в любом из трёх форматов, заданных стандартом ТЕЕЕ-754, что означа- 
ет, что операнд типа «память» должен быть четырёхбайтным (этот раз- 
мер можно указать знакомым нам словом амога), восьмибайтным или 
десятибайтным. Для обозначения восьмибайтных операндов ассемблер 
NASM предусматривает ключевое слово аднога (от слов quadro шота, учет- 
верённое слово), а для обозначения десятибайтных — слово мога (от ten 
шота). Есть и соответствующие псевдокоманды для описания данных (dq 
задаёт восьмибайтное значение, dt — десятибайтное), а также для pe- 
зервирования неинициализированной памяти (геза резервирует задан- 
ное количество восьмибайтных элементов, rest — заданное количество 
десятибайтных). Сам сопроцессор все действия выполняет с числами по- 
вышенной точности, а числа других форматов использует только при 
загрузке и выгрузке. 


$6.3. Обмен данными с сопроцессором 


Команда fld (от слов float load), имеющая один операнд, позволяет 
занести в регистровый стек число из заданного места, в качестве кото- 
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рого может выступать операнд типа «память» размера dword, qword или 
tword, либо регистр $Тп. Например, команда 


fld з+о 
создаёт копию вершины стека, а команда 
fld qword [matrix+ecx*8] 


загружает в стек из массива matrix, состоящего из восьмибайтовых чи- 
сел, элемент с номером, хранящимся в регистре ЕСХ. При этом в регистре 
SR уменьшается значение числа ТОР, так что вершина стека сдвигается 
вверх, старая вершина получает имя 571 и т. д. 

Извлечь результат из сопроцессора (с вершины регистрового стека) 
можно командами fst и fstp, имеющими один операнд. Чаще всего это 
операнд типа «память», но можно указать и регистр из стека, например 
5Т6, важно только, что этот регистр должен быть пустым. Основное от- 
личие между этими двумя командами в том, что fst просто читает число, 
находящееся на вершине стека (т. е. в регистре STO), тогда как fstp извле- 
кает число из стека, помечая STO как свободный и увеличивая значение 
ТОР. Команда fst почему-то не умеет работать с 80-битными операнда- 
ми типа «память», у fstp такого ограничения нет. Отметим ещё один 
момент: команда 


fstp в%0 


сначала записывает содержимое STO в него же самого, а затем вытал- 
кивает STO из стека; таким образом, эффект от этой команды состоит в 
уничтожении значения на вершине стека. Так обычно делают в случае, 
если число, находящееся на вершине стека, в дальнейших вычислениях 
не нужно. 

Часто бывает нужно перевести целое число в формат с плавающей 
точкой и наоборот. Команда +114 позволяет взять из памяти целое чис- 
ло и записать его в стек сопроцессора (естественно, уже в «плавающем» 
формате). Команда имеет один операнд, обязательно типа «память», раз- 
мера word, dword или qword (в этом случае имеется в виду восьмибайтное 
целое). Команды fist и fistp производят обратное действие: берут чис- 
ло, находящееся в STO, округляют его до целого в соответствии с уста- 
новленным режимом округления и записывают результат в память по 
адресу, заданному операндом. По аналогии с командами fst и fstp, KO- 
манда fst никак не изменяет сам стек, а команда fstp убирает число 
из стека. Операнд команды fstp может быть размера word, кога или 
ачога, команда fst умеет работать только с мога и амога. 

Команда #хсһ позволяет обменять местами содержимое вершины CTE- 
ка (STO) и любого другого регистра STn, который указывается в качестве 
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её операнда. Регистры не должны быть пустыми. Чаще всего fxch nc- 
пользуют, чтобы поменять местами STO и $Т1, в этом случае операнд 
можно не указывать. 

Сопроцессор поддерживает ряд команд, позволяющих загрузить в 
стек часто употребляемые константы: #141 (загружает 1.0), #142 (за- 
гружает +0.0), #1арі (загружает п), #1412е (загружает logs е), #1912% 
(загружает log, 10), #19112 (загружает ln 2), #19152 (загружает lg 2). Все 
эти команды не имеют операндов; в результате выполнения каждой из 
них значение ТОР уменьшается, и в новом регистре STO оказывается соот- 
ветствующее значение. От установленного режима округления зависит, 
в какую сторону будет отличаться загруженное приближённое значение 
от математического. 


$6.4. Команды арифметических действий 


Простейший способ выполнения четырёх действий арифметики на 
сопроцессоре — это команды fadd, fsub, fsubr, fmul, fdiv и fdivr с 
одним операндом, в качестве которого может выступать операнд типа 
«память» размера dword или амога. Команды fadd и fmul выполняют 
соответственно сложение и умножение регистра STO со своим операндом, 
команда fsub вычитает операнд из STO, команда fdiv делит STO на свой 
операнд, fsubr, наоборот, вычитает STO из своего операнда, fdivr де- 
лит свой операнд на STO; результат всех команд записывается обратно в 
STO. Все шесть команд могут быть использованы и без операндов, в этом 
случае роль операнда играет ST1. 

Все перечисленные команды имеют также форму с двумя операнда- 
ми, при этом в роли обоих операндов могут выступать только регистры 
STN, причём одним из них обязан быть STO (но он может быть как Nep- 
вым, так и вторым операндом). В этом случае команды выполняют зал 
данное действие над первым и вторым операндами и результат помещают 
в первый операнд. 

Кроме того, все шесть команд имеют ещё и «выталкивающую» форму, 
которая называется, соответственно, faddp, fsubp, fsubrp, fmulp, #аіури 
fdivrp; в этой форме команды имеют всегда два операнда-регистра ЗТп, 
причём второй операнд должен быть STO; после выполнения операции 
и занесения результата в первый операнд эти команды убирают из стека 
STO, то есть он помечается как пустой и значение ТОР увеличивается на 
единицу; вытесненное из стека число никуда не записывается. 

Команды в «выталкивающей» форме можно также записать без опе- 
рандов, в этом случае в качестве операндов используются ST1 и STO; дей- 
ствие в этом случае можно описать фразой «взять из стека два операнда, 
произвести над ними заданное действие, результат положить обратно в 
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стек». Отметим, что некоторые программисты считают достойными при- 
менения только команды в этой форме. Действительно, так можно вы- 
числить любое арифметическое выражение, если только оно не содержит 
слишком много вложенных скобок (иначе нам не хватит глубины стека). 
Для этого выражение нужно представить в так называемой польской ин- 
версной записи (ПОЛИЗ), в которой сначала пишутся операнды, потом 
знак операции; операнды могут быть сколь угодно сложными выражени- 
ями, также записанными в ПОЛИЗе. Например, выражение (x+y)*(1— z) 
в ПОЛИЗе будет записано так: х у + 1 - ж. Пусть х, y H Z у нас onn- 
саны как области памяти (переменные) длины мога и содержат числа с 
плавающей точкой. Тогда для вычисления нашего выражения мы можем 
просто перевести запись в ПОЛИЗе в запись на языке ассемблера, при 
этом каждый элемент ПОЛИЗа превратится ровно в одну команду: 


flad qword [x] ў 
fld qword [y] Н 
Тааар ; 
fld1 ; 
fld qword [z] ; 
fsubp я == 
fmulp ; ж 


Ne + ж 


Результат вычисления окажется в STO. Впрочем, применение других 
форм арифметических команд способно изрядно укоротить текст про- 
граммы; как несложно убедиться, следующий фрагмент делает абсолют- 
но то же самое: 


flad qword [x] 
fadd qword [y] 
Ё1а1 

fsub qword [z] 
fmulp 


Иногда бывают полезны имеющие один операнд команды fiadd, 
fisub, fisubr, fimul, fidiv и #іаіуг, выполняющие соответствующее 
арифметическое действие над STO и своим операндом, который должен 
быть типа «память» размера мога или dword и рассматривается как це- 
лое число. 

В заключение разговора о простейшей арифметике упомянем ещё три 
команды. Команда fabs вычисляет модуль STO, команда fchs (от слов 
change sign — сменить знак) меняет знак STO на противоположный, KO- 
манда #гпаіп+ округляет STO до целого в соответствии с установленным 
режимом округления. Результат записывается обратно в STO Все три KO- 


манды имеют только одну форму — без операндов. 
Команды #ргет, Ёргеш1, fscale, fxtract оставляем любознательным чита- 
телям для самостоятельного изучения. 
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86.5. Команды вычисления математических 
функций 


Команды 31, Ёсоз и fsqrt вычисляют, соответственно, синус, KOCH- 
нус и квадратный корень числа, лежащего в STO, результат помещается 
обратно в STO. Команда fsincos чуть сложнее: она извлекает из стека 
число, вычисляет его синус и косинус и кладёт их в стек, так что синус 
оказывается в ST1, косинус в STO, а всего в стеке оказывается на одно 
число больше, чем было до выполнения команды. 

Несколько экзотично ведёт себя команда Ёрёап, вычисляющая тан- 
генс. Она берёт аргумент из STO, вычисляет его тангенс, заносит резуль- 
тат обратно в STO, но после этого добавляет в стек ещё число 1, так что в 
стеке оказывается на одно число больше, чем до выполнения команды, и 
при этом в 5ТО находится единица, а результат вычисления тангенса на- 
ходится в 5Т1. Целью всей этой пляски является упрощение вычисления 
котангенса: его теперь можно вычислить уже знакомой нам командой 
fdivr; если же котангенс не нужен, избавиться от единицы можно, раз- 
делив на неё, то есть командой #аіур, или просто выкинуть её из стека 
командой fstp 350. 

Команда fpatan вычисляет arctg A где т — значение B STO, у — значе- 
ние в 9Т1. Эти два числа из стека изымаются, результат записывается в 
стек, так что в стеке оказывается на одно число меньше, чем было. Знак 
результата совпадает со знаком у, модуль результата не превосходит т. 

Кроме того, сопроцессор предусматривает команды #2хш1, #у12х и #у12хр. 
Команда #2хті вычисляет 27 — 1, где x — значение STO, результат заносит об- 
ратно в STO. Аргумент не должен по модулю превосходить l, иначе результат 
неопределён. Команды #у12х и #у12хр вычисляют у х 1055 т и ух loga(x + 1), 
где x — значение STO, у — значение 5Т1; эти значения из стека убираются, а 
результат добавляется в стек, так что в итоге в стеке остаётся на одно число 
меньше, чем было, и на вершине находится результат вычисления. При выполне- 
нии #у12хр1 значение 1 не должно по модулю превосходить 1 + х2. в противном 
случае результат неопределён. Читателю предлагается самостоятельно догадать- 
ся, для чего нужны эти три команды и как ими пользоваться. 

Операнды у всех команд из этого параграфа не предусмотрены. 


$ 6.6. Сравнение и обработка его результатов 


Общая идея сравнения и действий в зависимости от его результа- 
тов для чисел с плавающей точкой такая же, как и для целых: сначала 
производится сравнение, по итогам которого устанавливаются флаги, а 
затем используется команда условного перехода в зависимости от состо- 
яния флагов. Всё несколько осложняется тем, что у арифметического 
сопроцессора своя система флагов, причём основной процессор не имеет 
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команд условного перехода по этим флагам. Поэтому в привычную схе- 
му приходится добавить ещё и установку флагов основного процессора, в 
соответствии с текущим состоянием флагов сопроцессора. 


Сравнение можно выполнить командами ?сош, Ёсошр и #сошрр. Ko- 
манды fcom и Ёсошр имеют один операнд — либо типа «память» размера 
dword или амога, либо регистр ЗТп; операнд можно опустить, тогда в его 
роли выступит ST1. Команды сравнивают STO со своим операндом (или 
с 9Т1, если операнд не указан. Команда Ёсошр отличается от Ёсот тем, 
что выталкивает из стека STO. Команда fcompp, не имеющая операндов, 
сравнивает STO с ST1 и выталкивает их оба из стека. 


В результате выполнения команд сравнения устанавливаются флаги 
СЗ и СО в регистре SR (см. стр. 169) следующим образом: при равенстве 
сравниваемых чисел СЗ устанавливается в единицу, СО — сбрасывается 
в ноль; в противном случае СЗ сбрасывается, и если первое из сравни- 
ваемых (то есть число, находившееся в регистре STO) больше второго 
(заданного операндом или регистром ST1), то СО устанавливается в еди- 
HANY, если же меньше — то сбрасывается. Флаг СЗ оказывается, таким 
образом, по смыслу аналогичным флагу 7Е, а флаг СО — флагу СЕ (при 
сравнении беззнаковых целых). 

На самом деле команды сравнения устанавливают ещё и флаг С2, причём если 
всё в порядке — то он сбрасывается в ноль, если же числа несравнимы (например, 
оба числа — «плюс бесконечности», или одно из них — «не-число») и сопроцессор 
при этом настроен так, чтобы не инициировать прерывания в этих ситуациях — 
то С2 устанавливается в единицу. 

Чтобы результатом сравнения можно было воспользоваться для 
условного перехода, необходимо скопировать флаги из СВ в регистр FLAGS 
основного процессора. Это делается командами 


fstsw ах 
sahf 


Первая из них копирует SR в регистр АХ, а вторая загружает некоторые 
(не все!) флаги в FLAGS из АН. В частности, после выполнения этих двух 
команд значение флага СЗ копируется в ZF, а значение СО — в СЕЎ, что 
полностью соответствует нашим потребностям: теперь мы можем вос- 
пользоваться для условного перехода любой из команд, предусмотренных 
для беззнаковых целых чисел: ја, jb, jae, jbe, jna и т.д. (см. табл. 2.3 
на стр. 62). Подчеркнём ещё раз, что использование именно этих команд 
обусловлено только тем, что результат сравнения оказался во флагах СЕ 
и 7Е, больше ничего общего между числами с плавающей точкой и без- 
знаковыми целыми, вообще говоря, нет. 


ЗОтметим на всякий случай, что флаг C2 при этом копируется в РЕ. 
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Пусть, например, у нас есть переменные а, b и ш размера qword, содер- 
жащие числа с плавающей точкой, и мы хотим занести в ш наименьшее 
из а и b. Это можно сделать так: 


fld qword [b] ; b на вершину стека (в STO) 

fld qword [а] ; теперь а в STO, b в ST1 

fcom ; сравниваем их 

fstsw ах ; копируем флаги в АХ 

зав 5 и оттуда - в FLAGS 

ја Іра ; если а>Ъ - прыгаем 

fxcn ; иначе меняем числа местами 
1ра: ; теперь большее в STO, меньшее в ST1 

fstp в%0 ; ликвидируем ненужное большее 

їзїр qword [m] ; записываем в память меньшее 


«Ненужное» число можно было бы убрать из стека и иначе. Вместо предпо- 
следней команды можно было бы дать две команды: сначала ffree 5+0, которая 
пометит регистр STO как свободный, потом fincstp, которая увеличит значение 
ТОР на единицу. Эти команды рассматриваются в $ 6.7.3. 

В ряде случаев могут оказаться полезны также команды ?1сош и 
#ісотр, всегда имеющие один операнд типа «память» размера word или 
dword и рассматривающие этот операнд как целое число. В остальном 
они аналогичны командам #сот и fcomp: первым операндом сравнения 
выступает STO, по результатам сравнения устанавливаются флаги C3, C2 
и СО. Команда #1сопр, в отличие от #1сош, выталкивает STO из стека. Ha- 
конец, команда #%3%, не имеющая операндов, сравнивает вершину стека 
с нулём. 


& 6.7. Управление сопроцессором 


66.7.1. Исключительные ситуации и их обработка 


В результате выполнения вычислений с плавающей точкой могут воз- 
никать исключительные ситуации, что в некоторых случаях CBH- 
детельствует об ошибке в программе или входных данных, а в других 
случаях может отражать вполне штатные особенности хода вычислений. 
Различают шесть таких ситуаций: 


1. Недопустимая операция (Invalid Operation, #1) — попытка исполь- 
зования «не-чисел» в качестве операндов, попытка извлечь квад- 
ратный корень или логарифм из отрицательного числа и т. п. Также 
это может означать ошибку стека: попытку записать новое число в 
заполненный стек (то есть когда все восемь регистров заняты), ли- 
бо попытку вытолкнуть число из стека, когда в стеке нет ни одного 
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числа, либо попытку использовать в качестве операнда регистр, ко- 
торый в настоящее время пуст. 


2. Денормализация (Denormalized, #0) — попытка выполнения опера- 
ции над денормализованным числом, либо результат очередной опе- 
рации столь мал по модулю, что не может быть преставлен иначе 
как в виде денормализованного числа. 


3. Деление на ноль (Zero divider, #7) — попытка деления на ноль. 


4. Переполнение (Overflow, #0) — результат очередной операции столь 
велик, что не может быть представлен в виде числа с плавающей 
точкой имеющихся размеров (частным случаем этой ситуации явля- 
ется перевод числа из внутреннего десятибайтного представления 
в четырёх- или восьмибайтное представление с помощью, напри- 
мер, команды fst в случае, если в новое представление число «не 
влезает»). 


5. Антипереполнение (ОпаегНо\, #0) — результат столь мал по MO- 
дулю, что не может быть представлен в виде числа с плавающей 
точкой нужного размера (в том числе при выполнении команды 
fst, см. выше). 


6. Потеря точности (Precision, #Р) — результат операции не может 
быть представлен точно имеющимися средствами; в большинстве 
случаев это абсолютно нормально. 


В каждом из регистров СВ и SR младшие шесть бит соответствуют 
перечисленным ситуациям в том порядке, в котором они перечислены: 
бит №0 соответствует недопустимой операции, бит №1 — денормализа- 
ции, и т.д.; бит №5 соответствует потере точности. Кроме того, в ре- 
гистре SR бит №6 соответствует ошибке стека. При этом биты регистра 
СВ управляют, тем, что процессор должен сделать при возникновении 
исключительной ситуации. Если соответствующий бит сброшен, то при 
возникновении исключения будет инициировано внутреннее прерывание 
(см. 8 4.2.2). Если же бит установлен, исключительная ситуация считает- 
ся замаскированной и процессор при её возникновении никаких прерыва- 
ний инициировать не будет; вместо этого он постарается синтезировать, 
насколько это возможно, релевантный результат (например, при делении 
на ноль результатом будет «бесконечность» соответствующего знака; при 
потере точности результат округлится до машинно-представимого числа, 
в соответствии с установленным режимом округления, и т. д.) 

При возникновении любой исключительной ситуации сопроцессор 
устанавливает в единицу соответствующий бит (флаг) в регистре SR. Ec- 
ли ситуация не замаскирована, этот бит пригодится операционной си- 
стеме в обработчике прерывания, чтобы понять, что произошло; если 
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же ситуация замаскирована и прерывания не произойдёт, установленные 
флаги можно использовать в программе, чтобы отследить возникшие ис- 
ключения. Следует учитывать, что эти флаги сами по себе никогда не 
сбрасываются, их можно сбросить только явно, и это делается командой 
#с1ех. Команды для взаимодействия с регистрами СВ и SR мы подробно 
рассмотрим в $ 6.7.3. 


6 6.7.2. Параллельное выполнение и команда Wait 


Сопроцессор, являясь логически обособленной частью процессора, не 
имеет доступа к машинным командам, находящимся в памяти, и не умеет 
их декодировать; декодирование команд осуществляет основной процес- 
сор, он же выдаёт сопроцессору указания к действию. При этом сопроцес- 
сор выполняет команды асинтронно, то есть основной процессор может 
продолжать выполнение «своих» команд (таких, чьи имена не начинают- 
ся СЕ), не дожидаясь результата работы сопроцессора. С одной стороны, 
это позволяет повысить эффективность работы программ; с другой сто- 
роны, такая параллельная работа, может создать определённые пробле- 
мы в двух случаях: во-первых, когда последная Е-команда записывает 
что-то в оперативную память, а очередная команда основного процессо- 
ра должна этот результат использовать; и, во-вторых, когда очередная 
операция сопроцессора приводит к возникновению исключительной си- 
туации — при этом дальнейшая работа основной программы может быть 
бессмысленной, но из-за асинхронного выполнения Е-команд прерывание 
может возникнуть, когда основная программа, уже успела выполнить ряд 
инструкций. 

Для синхронизации работы основного процессора с арифметическим 
сопроцессором используется команда fwait или просто wait (на самом 
деле это два обозначения одной и той же машинной команды). Эта, ко- 
манда дожидается завершения всех действий, которые были арифмети- 
ческому сопроцессору заданы; в том числе, если в результате этих дей- 
ствий было инициировано прерывание, то выполнение команд после Wait 
продолжится уже после возврата, из прерывания, если, конечно, таковой 
вообще состоится (обычно в ОС Unix прерывание, инициированное CO- 
процессором, приводит к отправке сигнала ЗТСЕРЕ текущему процессу, B 
результате чего процесс завершается). 

Интересно, что многие мнемонические обозначения команд сопроцес- 
сора, на самом деле соответствуют двум машинным командам: сначала 
идёт команда Wait, затем — команда, выполняющая нужное действие. 
Примером такой мнемоники является уже знакомая нам fstsw: на Ca- 
мом деле, это две команды — Wait и fnstsw; при необходимости можно 
использовать Ёпз%зи отдельно, без ожидания, но для этого необходимо 
твёрдо понимать, чтб именно вы делаете. Точно так же устроена команда 
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№5014. 43: 12: 11 10359: 28: 7 56-15 4% 3 12. А0 0 


СВ ІС ВС РС ТЕМ РМ | ум | ом (7м |рм | IM 
15 4 13 12 11 10 9 8 7 6 5 4 3 2 1 0 
SR В | СЗ ТОР С2 | С1|С0|ТВ| 5Е (РЕ | ОЕ| ОЕ | 7Е (РЕ | ТЕ 
15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 
TW tag7 | tag6 | tag5 | tag4 | tag3 | tag2 | tag1 | +адо 


Рис. 6.2. Разряды регистров CR, SR и TW 


fclex из предыдущего параграфа: это обозначение соответствует машин- 
ным командам Wait и Ёпс1ех. 


6 6.7.3. Регистры СЕ, SR и TW 


Как уже говорилось, управление режимом работы сопроцессора осу- 
шествляется установкой содержимого регистра СЕ (Control Register), а по 
результатам выполнения операций процессор устанавливает содержимое 
регистра SR (Status Register), которое можно проанализировать. Наконец, 
текушее состояние регистров, составляющих стек, отражено в регистре 
Ти (Tag Word). Назначение разрядов, составляющих регистр управле- 
ния СВ, регистр состояния SR и регистр меток TW, показано на рис. 6.2. 
Большая часть этих разрядов нам уже известна; так, младшие шесть бит 
в регистрах СВ и SR представляют собой соответственно маски и фла- 
ги для шести типов исключительных ситуаций (см.8 6.7.1). Биты ІС и 
ТЕМ регистра СВ в современных процессорах не используются. Биты АС 
(Rounding Control) управляют режимом округления: 00 — к ближайшему 
числу, 01 — в сторону уменьшения, 10 — в сторону увеличения, 11 — в 
сторону нуля. Биты РС (Precision Control) задают точность выполняемых 
операций: 00 — 32-битные числа, 10 — 64-битные числа, 11 — 80-битные 
числа (по умолчанию используется именно этот режим, и необходимость 
его изменить возникает крайне редко). 

В регистре SR флаги СЗ, C2 и СО обычно используются как признак 
результата операции сравнения (см. § 6.6); флаг Ci обычно не использует- 
ся; флаг SF указывает на происшедшую ошибку стека. Флаг ТВ (Interrupt 
Request) указывает на возникновение незамаскированной исключитель- 
ной ситуации, в результате чего инициировано внутреннее прерывание; 
увидеть этот флаг установленным можно только в обработчике преры- 
вания внутри операционной системы, так что нас он не касается. Значе- 
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ние ТОР, как уже говорилось, задаёт текушую позицию вершины стека 
(см. $ 6.2). Наконец, бит В (Busy) означает, что сопроцессор в настоящий 
момент занят асинхронным выполнением команды. Надо сказать, что в 
современных процессорах этот бит тоже невозможно увидеть установ- 
ленным иначе как в обработчике прерывания. 

Регистр TW мы уже рассматривали на стр. 170. 

Для работы с регистром СВ предусмотрены команды fstcw, fnstcw и 
#1аси. Команда fstcw, как обычно, означает две машинные инструкции 
wait и fnstcw. Все три команды имеют один операнд, в качестве которого 
может выступать только операнд типа «память» размером word. Первые 
две команды записывают содержимое регистра CR в заданное место в 
памяти, последняя команда, наоборот, загружает содержимое регистра 
СВ из памяти. Например, следующими командами мы можем установить 
режим округления «в сторону нуля» вместо используемого по умолчанию 
режима «к ближайшему»: 


sub esp, 2 ; выделяем память в стеке 
fstcw [esp] ; получаем в неё содержимое СВ 
ог мога [esp], 0000110000000000Ъ 

; принудительно устанавливаем биты 11 и 10 
fldcw [esp] ; загружаем полученное обратно в СВ 
ааа езр, 2 ; освобождаем память 


Содержимое регистра ЗВ можно получить уже знакомой нам коман- 
ДОЙ fstsw, операнд которой может быть либо регистром АХ (и больше 
никаким), либо типа «память» размером мога. Имеется также коман- 
да fnstsw, причём fstsw представляет собой обозначение для двух Ma- 
шинных инструкций wait и fnstsw. Отметим, что обратная операция 
(загрузка значения) для SR не предусмотрена, что вполне логично: этот 
регистр нужен, чтобы анализировать происходящее. Тем не менее, неко- 
торые команды воздействуют на этот регистр напрямую. Так, значение 
ТОР можно увеличить на единицу командой fincstp и уменьшить на 
единицу командой fdecstp (обе команды не имеют операндов). Исполь- 
зовать эти команды следует осторожно, поскольку статус «занятости» 
регистров стека они не меняют; иначе говоря, fdecstp приводит к тому, 
что регистром STO становится «пустой» регистр, а fincstp приводит к TO- 
му, что 8Т7 оказывается «занят» (поскольку это бывший STO). Ещё одно 
активное действие с регистром SR, которое может выполнить програм- 
мист — это очистка флагов исключительных ситуаций. Такая очистка 
производится командами #с1ех (Clear Exceptions) и #пс1ех, которые мы 
уже упоминали в предыдущем параграфе. 

Перед командой {19см рекомендуется всегда выполнять команду Ёс1ех, иначе 
может случиться так, что запись регистра СВ «демаскирует» какое-нибудь из ис- 
ключений, флаг которого уже взведён, в результате чего произойдёт прерывание. 


180 


Регистр TW не может быть напрямую ни считан, ни записан, но одна 
команда, напрямую воздействующая на него, всё же есть. Она, называет- 
ся ЕЁтее, имеет один операнд — регистр ЗТп, а её действие — пометить 
заданный регистр как «свободный» (или «пустой»). В частности, следу- 
ющие команды убирают число с вершины стека, «в никуда»: 


ffree 5+0 
fincstp 


§ 6.7.4. Инициализация, сохранение и восстановление 


Если на момент начала вычислений вам не известно (или вызывал 
ет сомнения) состояние арифметического сопроцессора, но при этом вы 
точно знаете, что никакой полезной для вас информации его регистры 
не содержат, можно привести его «в исходное состояние» с помощью 
команды finit или fninit (finit представляет собой обозначение для 
wait fninit, см. $ 6.7.2). При этом в регистр СВ заносится значение 037Fh 
(округление в ближнюю сторону, наибольшая возможная точность, все 
исключения замаскированы); регистр SR обнуляется, что означает ТОР=0, 
все флаги сброшены, включая флаги исключительных ситуаций; реги- 
стры FIP, FDP, TW также обнуляются; регистры, составляющие стек, никак 
не изменяются, но поскольку TW обнулён, все они считаются свободными 
(не содержащими чисел). 

С помощью команды Ёзауе можно сохранить всё состояние сопроцес- 
сора, то есть содержимое всех его регистров, в области памяти, чтобы 
потом восстановить его. Это полезно, если нужно временно прекратить 
некий вычислительный процесс, выполнить какие-то вспомогательные 
вычисления, затем вернуться к отложенному процессу вычислений. Для 
сохранения вам потребуется область памяти длиной 108 байт; команда 
Ёзауе имеет один операнд, это операнд типа «память», причём указы- 
вать его размер не нужно. Мнемоника fsave на самом деле обозначает 
две машинные команды — Wait и fnsave. После сохранения состояния 
в памяти сопроцессор приводится «в исходное состояние» точно так же, 
как при команде finit (см. выше), так что после fsave отдельно давать 
команду finit не нужно. Восстановить сохранённое ранее состояние CO- 
процессора можно командой frstor; как и fsave, эта команда имеет один 
операнд типа «память», для которого не нужно указывать размер, по- 
скольку используется область памяти размером 108 байт. 

Иногда возникает потребность сохранить или восстановить только вспомога- 
тельные регистры сопроцессора. Это делается командами fsetenv, fnsetenv n 
fldenv с использованием области памяти длиной 28 байт; подробное описание 
этих команд оставляем за рамками пособия. 

В завершение разговора о сопроцессоре упомянем команду Ёпор. Как 
можно догадаться, это очень важная команда: она не делает ничего. 
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Приложение: текст файла stud_io.inc 


Версия для ОС Linux 


; generic З-рагат syscall 
macro _syscall_3 4 

push edx 

push ecx 

push ebx 

push %1 

push %2 

push %3 

push /4 

pop edx 

pop ecx 

pop ebx 

pop eax 

int 0x80 

pop ebx 

pop ecx 

pop edx 
^епатасго 
; вуѕса11_ехії is the only syscall we use that has 1 parameter 
macro _syscall_exit 1 


mov ebx, %1 ; exit code 
mov eax, 1 ; 1 = sys_exit 
int 0x80 

Жепашасго 


; А1: descriptor %2: buffer addr %3: buffer length 
; output: eax: read bytes 
macro _syscall_read 3 
_зузса11_3 3,/1,/2,/3 
%endmacro 


; ⁄1: descriptor %2: buffer addr %3: buffer length 
; output: eax: written bytes 
macro _syscall_write 3 
_зузса11_3 4,/1,/2,/3 
^епатасго 


%macro PRINT 1 
pusha 
pushf 
jmp 4hastr 
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1435г db 41, O 


Ahstrlin еди $-4hstr 

„азр: _syscall_write 1, %⁄4str, ⁄4strln 
рорЁ 
рора 

Жепашасго 


Ушасто РОТСНАВ 1 


pusha 

pushf 
hifstr %1 

mov al, %1 
%elifnum %1 

mov al, %1 
%elifidni %1,al 

nop 
%elifidni %1,ah 

mov al, ah 
%elifidni /1,Ъ1 

mov al, bl 
%elifidni %1,bh 

mov al, bh 
%elifidni %1,c1l 

mov al, cl 
%elifidni %1,ch 

mov al, ch 
%elifidni /1,а1 

mov al, dl 
%elifidni %1,dh 

mov al, dh 
else 

mov al, /1 ; memory location such аз [var] 
%endif 

sub esp, 2 ; reserve memory for buffer 

mov edi, esp 

mov [edi], al 

-syscall_write 1, edi, 1 

add esp, 2 

popf 

popa 
/епатасго 


Хтасго GETCHAR О 


pushf 

push edi 

sub esp, 2 
mov edi, esp 
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_ѕуѕса11_геаа 0, edi, 1 


сшр еах, 1 

јпе A%eof_reached 

хог eax,eax 

mov al, [edi] 

jmp %#ксдаи1% 
#ЖЖео?_геасһеа: 

хог еах, еах 

not eax ; eax := -1 
%%#ксди1ї: 

ааа езр, 2 

рор edi 

popf 
Жепашасго 


Утасго FINISH 0-1 0 
_зузса11_ех1% {1 
/епатасго 


Версия для FreeBSD 


Эта версия отличается от предыдущей только определением макросов 
_зузса113 и _зузса11_ех1%, поэтому целиком мы её не приводим. Чтобы no- 
лучить рабочий файл для ОС FreeBSD, возьмите вышеприведённый текст для 
ОС Linux и замените определения этих макросов на следующие: 


macro _ѕуѕса11_3 4 


push %4 

push %3 

push %2 

mov eax, 71 

push eax 

int 0x80 

jnc Ahok 

neg eax 
лок: add esp, 16 
%endmacro 


%macro _syscall_exit 1 


push 41 ; exit code 

mov eax, 1 ; 1 = sys_exit 

push eax 

int 0x80 

; no cleanup - this will never return anyway 
^епатасго 


184 


Литература 


[1] Э. Танненбаум. Архитектура, компьютера. 4-е издание. СПб.: Питер, 
2003. 


[2] Зубков С.В. Assembler для DOS, Windows и UNIX. М.:ЛМК, 2006. 


— 


[3 


== 


Баурн С. Операционная система UNIX. М.:Мир, 1986. 


[4] Робачевский А.М. Операционная система UNIX. Изд-во «ВНУ», 
Санкт-Петербург, 1997. 


[5] Тһе Netwide Assembler: NASM. һїїр: //мии.пази.из/9ос/ Имеет- 
ся русский перевод, выполненный АѕтОѕ group; см. например, 


Һр: //орѕ1а.отд.ти/паѕт 


= 


[6] Raymond Filiatreault. Simply FPU (ап FPU tutorial). 2003. 


http://wwvw.ray.masmcode .com/fpu.html 


[ылы 


Домашняя страница этой книги в сети 
Интернет расположена по адресу 
http://www.stolyarov.info/books/asm_unix 
Здесь вы можете получить тексты примеров 
программ, приведённых в этой книге, а также 
электронную версию самой книги. 


185 


Оглавление 


Предисловие для преподавателей ................. 3 

Предисловие для студентов ..................... 5 

Благодарности и посвящение ................... T 

1. Введение 8 

$ 1.1. Машинный код и ассемблер.................. 8 
$ 1.2. Особенности программирования под управлением мульти- 

задачных операционных систем ................ 14 

$ 1.3. Машинное представление целых чисел. ........... 17 

§ 1.3.1. Беззнаковые числа ................... 18 

§ 1.3.2. Знаковые числа; дополнительный код ........ 20 

$ 1.4. История платформы 1386 ................... 22 

$ 1.5. Знакомимся с инструментом ................. 24 

$ 1.6. Макросы из файла stud_io.inc ............... 32 

2. Процессор 1386 33 

& 2.1. Система регистров13486..................... 33 

§ 2.2. Память, регистры и команда MOV ............... 37 

$2.2.1. Память пользовательской задачи. Секции ..... 37 

§ 2.2.2. Директивы для отведения памяти .......... 39 

§ 2.2.3. Komamga mov ...................... 44 

§ 2.2.4. Виды операндов .................... 45 

§ 2.2.5. Прямая и косвенная адресация ............ 46 

§ 2.2.6. Общий вид исполнительного адреса ......... 48 

§ 2.2.7. Размеры операндов и их допустимые комбинации . 50 

§ 2.2.8. Команда lea ...................... 52 

§ 2.3. Целочисленная арифметика.................. 53 

§ 2.3.1. Простые команды сложения и вычитания ..... 53 

$2.3.2. Сложение и вычитание с переносом ......... 55 

§ 2.3.3. Команды inc, dec, neg и спр ............. 55 

§ 2.3.4. Целочисленное умножение и деление ........ 56 

§ 2.4. Условные и безусловные переходы .............. 58 


186 


§ 2.4.1. Безусловный переход и виды переходов ...... 
$ 2.4.2. Условные переходы по отдельным флагам .... 
$ 2.4.3. Переходы по результатам сравнений ....... 
$ 2.4.4. Условные переходы и регистр ECX; циклы .... 
$2.5. Побитовые операции ..................... 
$ 2.5.1. Логические операции ................ 
§ 2.5.2. Операции сдвига ................... 
92:53 Шримёр: ли a о а ан Л 
§ 2.6. Стек, подпрограммы, рекурсия ... aooo 
$ 2.6.1. Понятие стека и его предназначение ....... 
$ 2.6.2. Организация стека в процессоре 1386 ....... 


$ 2.6.3. Дополнительные команды работы со стеком 


$ 2.6.4. Подпрограммы: общие принципы ......... 
$ 2.6.5. Вызов подпрограмм и возврат из них ....... 
$ 2.6.6. Организация стековых фреймов .......... 


$ 2.6.7. Основные конвенции вызовов подпрограмм 


$ 2.6.8. Локальные метки ................... 
$:2.6:9-.ТТримерл Улук кл ек сои 
$2.7. Строковые операции ..................... 
$2.8. Ещё несколько интересных кокманд............. 
§ 2.9. Заключительные замечания................. 


3. Ассемблер МАЗМ 
$3.1. Синтаксис языка ассемблера NASM ............ 
$3.2. Псевдокоманды ........................ 
63:3: Константы оо на рр ела 
§ 3.4. Вычисление выражений во время ассемблирования .... 


§ 3.4.1. Вычисляемые выражения и операции в них 


§ 3.4.2. Критические выражения .............. 
§ 3.4.3. Выражения в составе исполнительного адреса ... 
$3.5. Макросредства и макропроцессор ............. 
$3.5.1. Основные понятия .................. 
$3.5.2. Простейшие примеры макросов .......... 
§ 3.5.3. Однострочные макросы; макропеременные .... 
63.5.4. Условная компиляция ................ 
§ 3.5.5. Макроповторения .... 0...0... 


§ 3.5.6. Многострочные макросы и локальные метки 
$ 3.5.7. Макросы с переменным числом параметров 


$ 3.5.8. Макродирективы для работы со строками .... 
$3.6. Командная строка NASM .................. 


4. Взаимодействие с операционной системой 


641. 


$4.2. 


$ 4.3. 


§ 4.4. 
§ 4.5. 


Мультизадачность и её основные виды ........... 
$ 4.1.1. Понятие одновременности выполнения ....... 
$ 4.1.2. Пакетный режим .................... 
§ 4.1.3. Режим разделения времени .............. 
$ 4.1.4. Режим реального времени .............. 
$4.1.5. Аппаратная поддержка мультизадачности ..... 
Виды прерываний........................ 
64.2.1. Внешние (аппаратные) прерывания ......... 
64.2.2. Внутренние прерывания (ловушки) ......... 
§ 4.2.3. Программные прерывания .............. 
Системные вызовы в ОС И шх................. 
§ 4.3.1. Конвенция ОС їлпих.................. 
$4.3.2. Конвенция ОС FreeBSD ................ 
§ 4.3.3. Некоторые системные вызовы Unix ......... 
Параметры командной строки .. a 
Пример: копирование файла ................. 


5. Раздельная трансляция 


85.1. 
$ 5.2. 
$ 5.3. 
$ 5.4. 
$5.5. 
$5.6. 


Что такое модули и зачем они нужны . ........... 
Поддержка модулей в NASM ................. 
Пример к с або ъз А, Я, мао ШААЛ 
Объектный код и машинный ккд............... 
Библиотеки оо аары шуы еә заросли 


6. Арифметика с плавающей точкой 


86.1. 
8 6.2. 
§ 6.3. 
$ 6.4. 
8 6.5. 
8 6.6. 
§ 6.7. 


Формат чисел с плавающей точкой.............. 
Устройство арифметического сопроцессора ......... 
Обмен данными с сопроцессором ............... 
Команды арифметических действий ............. 
Команды вычисления математических функций ...... 
Сравнение и обработка его результатов . .......... 
Управление сопроцессором .................. 
& 6.7.1. Исключительные ситуации и их обработка ..... 
$6.7.2. Параллельное выполнение и команда wait ..... 
$6.7.3. Регистры СВ, SR и ТМ... .. 
$6.7.4. Инициализация, сохранение и восстановление 


Приложение: текст файла 5®иай_%о.їпс ............ 
ЛАИШер@тр@ >>. Бы зок Л ДУ УКЕ А ооо 


